donderdag 20 mei 2010

PLANETS Time Capsule


Eergisteren heeft PLANETS een "digitale tijdcapsule" opgeslagen in de digitale kluis van Swiss Fort Knox, om te vieren dat het project bijna afgelopen is.
De Time Capsule is een metalen doos met daarin verschillende digitale objecten: een foto in jpg, een bericht in Java, een filmpje in MOV, in webpagina in HTML en een brochure in PDF. Daarnaast is van ieder object ook een representatie in "archief-formaat" toegevoegd zoals PDF/A, TIFF, JPEG2000 en MPEG4. Alle objecten zijn op verschillende dragers opgeslagen: floppy disks, CD's, DVD's, Flash-drives en HDD's, inclusief leesapparatuur. Verschillende objecten zijn blijkbaar ook op papier en microfilm vastgelegd. Verder is allerlei software toegevoegd: conversie-tools, viewers en OS-software. Tenslotte is alles beschreven: bestandsformaten, file systems, de objecten zelf en hun relaties met de soft- en hardware.

De objecten in de tijdcapsule zullen in de toekomst beschikbaar gesteld worden aan onderzoekers, zodat die kunnen vaststellen of en hoe het mogelijk is op basis van deze informatie de digitale objecten toegankelijk te maken.

Binnenkort zal PLANETS de bestanden op de website plaatsen, zodat anderen ook kunnen experimenteren met deze objecten. En, en dat vind ik heel interessant klinken, naar het schijnt, kunnen archieven en musea kopieën van de objecten krijgen die ze kunnen gebruiken voor exposities en tentoonstellingen.

Klik hier voor meer foto's van de plaatsing van de capsule.

Eerdere berichten over PLANETS

woensdag 10 maart 2010

Digitale depots in Nederland

In het Archievenblad van maart (nummer 2, 2010) staan verschillende artikelen over e-depots in Nederland: het Centraal Digitaal Depot van JustID, het digitaal depot van het Nationaal Archief, het e-depot van het Gemeentearchief Rotterdam en het e-depot Stadsarchief Amsterdam. (Nu ik het zo achter elkaar zet, valt me op dat ze bij het rijk spreken over digitale depots, terwijl de gemeenten het hebben over e-depots.)
De vier artikelen worden voorafgegaan door een soort review van de hand van Filip Boudrez. En eerlijk gezegd vind ik dat artikel het interessantste, omdat hij een paar vingers op 'zere plekken' legt.
Zo stelt hij vast dat ondanks dat de vier organisaties aangeven dat een e-depot meer is dan techniek, ze alle vier wel heel erg techniek georiënteerd zijn. Waarbij hij zich er impliciet over verbaast dat de organisaties alle vier er nadrukkelijk voor kiezen om fysieke opslag zelf te realiseren.

"Anders geformuleerd, een opslagomgeving is wel een belangrijke voorwaarde, maar vormt niet de essentie van een digitaal archiefdepot. Een digitaal depot is veel meer dan een storageinfrastructuur: het gaat om de processen en om de metadata. In die optiek komt het wat vreemd overdat het Gemeentearchief Rotterdam zijn serverruimte liet auditen om die als 'officiële digitale archiefbewaarplaats' te laten erkennen en die ruimte officieel de naam van 'digitaal depot' geeft."
Illustratief voor de techniek-georiënteerde benadering noemt hij ook het belang dat JustID hecht aan digitale handtekeningen om authentieke en integere archiefdocumenten te archiveren. Volgens Filip zegt een digitale handtekening niets over de authenticiteit en integriteit van een digitaal archiefdocument en verliest de geavanceerde digitale handtekening na verloop van tijd zijn validatie-functie. JustID heeft hier wel over nagedacht (en misschien wel een oplossing voor verzonnen), maar heeft daarmee geen duurzaam antwoord gegeven op het authenticiteits- en integriteitsvraagstuk. Uiteindelijk worden de gegevens uit handtekening en certificaat als metadata bij het archiefstuk opgeslagen.

En dat is het derde pijnpunt dat Filip aanwijst: de metadata. Het OAIS-model beschijft een archiefstuk en zijn metadata als één informationpackage. Dit is (mede) de reden waarom het Felixarchief er expliciet voor kiest om metadata en archiefstuk samen, in één pakketje te bewaren: ze zijn onlosmakelijk met elkaar verbonden. Bij alle vier de Nederlandse oplossingen worden metadata en archiefstuk gescheiden van elkaar opgeslagen en lijkt het er op dat er nauwelijks nagedacht is over de duurzaamheid van de metadata.
"De vraag naar de digitaal duurzame archivering van de informatiepackages gaat over de essentiële functionaliteit van een digitaal depot, en confronteert de digitale archivaris met de duurzaamheid of beprekte houdbaarheid van zijn digitale archiveringsoplossing. Het digitaal depot zelf, als archiveringssysteem is door zijn afhankelijkheid ten aanzien van hard- en software niet bestemd om op (middel-)lange termijn operationeel te blijven. Zijn inhoud dient echter wel digitaal duurzaam te zijn."
Ik begreep van Hans Berende dat de artikelen binnenkort ook digitaal beschikbaar komen. Dat is goed, want deze artikelen verdienen een ruimer publiek!

Toevoeging op 11 maart:
E-mail van Hans gekregen. De artikelen zijn hier te vinden.

maandag 1 februari 2010

Digitale autochtonen over digitale duurzaamheid

Op dit moment zijn het vooral digitale immigranten (of misschien moet ik wel allochtonen schrijven) die zich bezig houden met duurzame digitale toegankelijkheid. De meeste mensen bij archiefdiensten, onderzoeksinstellingen en bibliotheken zijn ruim voor de geboorte van internet en de alomtegenwoordigheid en beschikbaarheid van digitale informatie geboren.
Dat heeft voordelen, want dit zijn ook de mensen die uit ervaring weten dat digitale informatie niet vanzelf toegankelijk en vindbaar is en blijft. Toch is het interessant om te onderzoeken hoe de digitale autochtonen ("digital natives" in het Engels) aankijken tegen digitale duurzame toegankelijkheid.
De Amerikaanse Library of Congress organiseerde een tijdje geleden een workshop met middelbare scholieren over "Digital Preservation", waarbij het er vooral om ging om te achterhalen wat de scholieren belangrijk genoeg vonden om te bewaren (Facebook), wie verantwoordelijk voor het bewaren zou moeten zijn (ieder voor zich) en welke problemen zij nog zagen (selectie).
Hier is het transcript (pdf) van bovenstaand filmpje.

Dit soort workshops zijn niet alleen interessant om te achterhalen hoe digitale autochtonen naar digitale informatie kijken, maar ook hen wat meer bewust te maken van de problemen. Een van de studenten in het filmpje zegt:
“She said ‘once it’s online it’s there forever,’ and I wrote that down because that’s the truth…so, as soon as it’s on the internet it’s saved…”

De herkomst van dit soort ideeën is niet lastig te traceren, want is waarschijnlijk afkomstig van opvoeders die waarschuwen voor de gevaren van het posten van allerlei informatie en foto's op websites als Facebook, Hyves en Twitter. (Zie ook Delete. The virtue of forgetting in a digital age.) Maar het maakt het wel lastiger om hen ook duidelijk te maken dat er nog wel wat problemen kleven aan duurzame digitale toegankelijkheid.

Wie organiseert eens zo'n workshop in Nederland? Misschien is dat wel een mooie stage-opdracht voor een van de studenten van de UvA, HvA of Reinwardt-academie.

woensdag 4 november 2009

Digitale Tipp-Ex


Vroeger, zeker op de middelbare school, maar als ik het me goed herinner ook al op de lagere school (ja, zo oud ben ik al), gebruikten verschillende kinderen uit mijn klas Tipp-Ex om schrijffouten weg te lakken. Vreselijk: het stonk en het maakte kabaal, want je moest natuurlijk eerst heel goed schudden. Toen ik het zelf eens probeerde, bleek ook nog dat je er niets aan hebt als je met een vulpen schrijft, zoals ik van kinds af aan doe.

Ik moest hier aan denken toen ik een stukje van L’Archivista las over wat ze in Amerika ‘redaction’ noemen: het weglakken van vertrouwelijke informatie uit archiefstukken voordat deze gepubliceerd worden.
Bij papieren documenten is dat redelijk simpel: je maakt een kopie van het document, Tipp-ext alle problematische passages weg (je kunt hier natuurlijk ook een dikke zwarte alcohol-stift voor gebruiken) en maakt een nieuwe kopie van het document, die je ter inzage geeft. Dat dit bij digitale documenten iets ingewikkelder ligt, hebben we in Nederland pas nog gezien bij het voortijdig uitlekken van de Miljoenennota.
Een nog mooier voorbeeld is de actie van de Belastingdienst twee jaar geleden geleden, die toen in het kader van de WOB het Draaiboek Project Bank Zonder Naam op zijn website publiceerde. Allerlei vertrouwelijke informatie was met zwarte balken 'weggelakt', maar bleek redelijk simpel leesbaar te maken.

L'Archivista schrijft daar over:
There are also several really bad PDF redaction techniques. Never, ever use Adobe Acrobat's Draw or Annotate tool to place black, white, etc. boxes over information you wish to redact. Another spectacularly bad idea: "redacting" a word processing document by changing the font color to white or using a shading or highlighting feature to obscure the text and then converting the document to PDF format.

Hoe het wel moet, beschrijft ze kort in haar blog en uitgebreider in een presentatie tijdens de MARAC-conferentie een paar dagen geleden. (Ik heb die presentatie helaas nog niet gevonden.)
Er zijn verschillende hulpmiddelen die het mogelijk maken om pdf-bestanden te 'schonen', waaronder de standaard-functionaliteiten van Adobe Acrobat 8 en 9. Er zijn ook aparte applicaties die dit soort dingen doen, zoals Redax en Redact-It.

Haar belangrijkste, maar ook meest problematische advies, is dat het cruciaal is "to keep abreast of the relevant legal and digital forensics literature: people are trying to figure out how to crack these tools and techniques and recover redacted information, and one of them may eventually succeed."

Hier speelt het probleem van 'duurzame toegankelijkheid' eigenlijk andersom dan we gewend zijn. Een geschoond, papieren document zal altijd schoon blijven. Mits er goed gelakt is, zijn er simpelweg geen technieken om op basis van enkel het gekopieerde document de weggelakte informatie te reconstrueren. Maar bij een digitaal geschoond bestand, is het heel goed denkbaar dat de techniek die gebruikt is om te schonen na bijvoorbeeld een jaar al zodanig achterhaald is, dat de verwijderde passages eenvoudig terug te halen zijn. En als je deze bestanden via je website beschikbaar hebt gesteld, kun je er zeker van zijn dat er op diverse plekken nog kopieën opgeslagen zijn. Met alle mogelijke gevolgen van dien.

Er zijn twee redenen waarom deze problematiek relevant kan zijn voor digitale depots.
De eerste is dat er op dit moment de tendens is om digitale archiefbescheiden maar zo snel mogelijk in het digitaal depot op te nemen. Bij het Nationaal Archief start binnenkort een pilot waarbij een ministerie alle afgehandelde dossiers direct in het depot van het Nationaal Archief onderbrengt. Aangezien deze bestanden nog onder het regime van de WOB vallen, moet bij een verzoek om toegang bekeken worden of alle informatie wel openbaar is. Dat kan dus leiden tot het weglakken van bepaalde passages.
De tweede is de trend dat steeds meer (ook oudere) archiefbescheiden via internet beschikbaar gesteld worden, vooral bouwvergunningen zijn populaire dossiers. Het CBP heeft in zijn richtsnoer opgenomen dat ook in deze gevallen voorkomen moet worden dat gegevens over natuurlijke personen vrij beschikbaar komen. Ook hierbij kan dus sprake zijn van het 'schonen' van de gepubliceerde archiefbescheiden.

Worden met dit schonen archiefbescheiden gecorrumpeerd?
Ik denk het niet, op voorwaarde dat het schonen enkel gebeurd in het Beschikbaar Digitaal Archiefstuk (DIP in OAIS-termen) en niet in het Opgenomen Digitaal Archiefstuk (AIP in OAIS-termen). Het betekent natuurlijk wel dat een dienst bij het 'samenstellen' van een BDA hier rekening mee moet houden en moet documenteren dat er passages 'ontoegankelijk' gemaakt zijn.

Afbeelding: Oxna

donderdag 15 oktober 2009

Digitale duurzaamheid?


De afgelopen jaren heb ik er wel wat over gelezen, maar ik heb er eigenlijk nooit erg lang bij stilgestaan: de invloed van digitalisering op ons milieu. Vanochtend kwamen drie dingen samen:
  1. Vandaag is het Blog Action Day en dit jaar is het thema Climate Change
  2. In de NRC van gisteren las ik over een onderzoek van Tebodin naar het energiegebruik van de Nederlandse ICT-sector
  3. Afgelopen weken las ik via de weblog van Alan Ake over 'very  long term preservation'.
Uit het onderzoek van Tebodin bleek dat het aantal datacenters in Nederland in twee jaar met een kwart groeide (van 80 naar 100), maar dat het energieverbruik in diezelfde tijd met meer dan 50% steeg. Daarmee vertegenwoordigt de ICT-sector circa 2 procent van het nationale energieverbruik. (Volgens Tebodin is dit dan evenveel als de luchtvaartsector, maar ik vraag me af of bij de luchtvaartsector dan ook het energieverbruik van hun ICT-voorzieningen meegerekend is...) Bij datacentra gaat de meeste energie trouwens op aan de koeling en blijkbaar lukt het nog niet om met efficiënter koelen het stroomverbruik gelijk te houden aan de groei.

In The monster footprint of digital technology schrijft Kris de Decker dat het te beperkt is om alleen naar het energieverbruik te kijken. De Decker strooit zo gul met Watts, MegaJoules per kilo en MegaWattUren, dat het me een beetje duizelt. Maar zijn centrale punt is volgens mij dat de productie van microchips, processoren en nanomateriaal zo energie-intensief is, dat de energie die voor het gewoon gebruik van laptops en gadgets nodig is, daarbij bijna in het niet valt.

"The most up-to-date life cycle analysis of a computer dates from 2004 and concerns a machine from 1990. It concluded that while the ratio of fossil fuel use to product weight is 2 to 1 for most manufactured products (you need 2 kilograms of fuel for 1 kilogram of product), the ratio is 12 to 1 for a computer (you need 12 kilograms of fuel for 1 kilogram of computer). Considering an average life expectancy of 3 years, this means that the total energy use of a computer is dominated by production (83% or 7,329 megajoule) as opposed to operation (17%). Similar figures were obtained for mobile phones."



En Richard Heinberg brengt het allemaal bij elkaar:

"Ultimately the entire project of digitized cultural preservation depends on one thing: electricity. As soon as the power goes off, access to the Internet goes down. CDs and DVDs become meaningless plastic disks; e-books become inscrutable and useless; digital archives become as illegible as cuneiform tablets—or more so. Altogether, digitization represents a huge bet on society’s ability to keep the lights on forever."

Hij schetst scenario's waarbij tussen nu en 15 tot 20 jaar regelmatig 'black-outs' plaatsvinden en we dus voor kortere of langere tijd zonder stroom moeten leven. Naar aanleiding daarvan vindt Heinberg dat het de plicht van een bibliothecaris is, om ervoor te zorgen dat "essential cultural knowledge" analoog bewaard blijft. Het is me niet helemaal duidelijk of hij dan doelt op cultuuruitingen heeft, of op meer praktische antwoorden die nodig zijn om zonder stroom te kunnen overleven (Hoe zuiver ik water? Welke planten kun je eten?)

Maar uiteindelijk is de paradox dus dat het voortbestaan van datgene wat we de afgelopen jaren digitaal gemaakt hebben en de komende jaren zullen maken, afhankelijk is van de continue groei van de infrastructuur voor energieproductie en -consumptie. En juist die groei eist een steeds grotere, misschien wel catastrofale tol van milieu en maatschappij.

Misschien zou dit ook een aspect moeten zijn bij het maken en beheren van een Duurzaam Digitaal Depot (al bevat ED3 hier natuurlijk geen eisen  over).

Het plaatje is van Grace Grothaus.

maandag 28 september 2009

Officieel verslag "Toekomst voor ons digitaal geheugen" beschikbaar

Op de website van de NCDD is vandaag het officiële verslag van de werkconferentie van 18 september 2009 verschenen. Daarnaast zijn ook de presentaties van Abigail Potter en Inge Angevaare integraal opgenomen.

maandag 21 september 2009

Toekomst voor ons digitaal geheugen

"De Nederlandse overheid zorgt voor zijn digitale bestanden, zoals de burger thuis zorgt voor zijn digitale foto's."

Dat zou Martin Berendse de kabinetsformateur vertellen als hij naar "Beesterzwaag" mocht om het probleem van duurzame digitale toegankelijkheid uit te leggen.

Deze toch wel schokkende omschrijving was een van de uitkomsten van de werkconferentie "Toekomst voor ons digitaal geheugen: duurzame toegang tot informatie in Nederland" die de NCDD op 18 september in de KB organiseerde. Aanleiding voor de conferentie was de interrimrapportage van de Nationale Verkenning Duurzame Toegankelijkheid, die de NCDD op 1 juli 2009 publiceerde.  In het rapport worden op de beleidsterreinen Overheid, Cultuur en Wetenschap verschillende knelpunten voor de duurzame toegankelijkheid gezien. Hieronder een mindmap van de samenvatting die Inge Angevaare van het rapport gaf:



In twee Break out-sessies moesten vertegenwoordigers van de drie beleidsterreinen vast stellen of ze het eens waren met de in de rapportage geconstateerde knelpunten en welke oplossingen ze hiervoor zagen. Hieronder een weergave van de uitkomsten van alle sessies:



Ik heb (uiteraard) deelgenomen aan de sessie voor de Overheid. De eerste, waarin we de problemen moesten benoemen was heel interessant. Al verzuchtte een van de deelnemers terecht: "De eerste publicaties over digitale duurzaamheid dateren uit 1988 en we zijn nog geen stap verder!" Een van de conslusies was dan ook dat 'de sector' de afgelopen jaren niet verder gekomen is dan 'het rondspelen van de bal' en het uitdenken van 100% perfecte oplossingen.

In de sessie na de lunch moesten we oplossingen aandragen voor de geconstateerde problemen. Eerlijk gezegd ben ik er nog niet in geslaagd om de oplossingen die 'we' bedacht hebben te laten aansluiten op de geconstateerde problemen. We begonnen met 'grote' problemen als De democratie is in gevaar  en uiteindelijk zijn de oplossingen een aanwijzing van hogerhand om de duurzaamheid te regelen en een 'financiële impuls'.
Het gebeurde voor mijn ogen, maar ik weet nog altijd niet wat er gebeurd is.

In de paneldiscussie daarna ging het maar heel even over de knelpunten in het rapport, iedere sector herkende en erkende deze. Het ging meer over het zijn en wezen van de NCDD. De 'wetenschappers' verwoordden het probleem helder: "De NCDD moet blijven bestaan, maar we weten niet in welke vorm en met welke taken." Toen de leden van het bestuur hiernaar gevraagd werd, was het antwoord een soort jij-bak "Wat verwacht u van ons? Wat willen jullie dat wij doen?" Dat leverde wat ongemakkelijk gewiebel op, totdat Jeroen van Os (gemeentearchivaris van Utrecht) opstond en aangaf dat hij vooral een agenda verwacht: dit gaat de NCDD de komende jaren wel doen en dit zal de NCDD niet doen.
Een andere vraag (van Maarten Schenk, namens BRAIN in dit geval) aan de leden van het bestuur was: "Wat verwachten jullie dat wij als instellingen doen? Moeten we allemaal lid worden?" Het ietwat gemakkelijke antwoord hierop was dat iedereen lid moest worden, want dan was er meer geld beschikbaar om de goede dingen te doen.

Later begreep ik uit de weblog van Inge Angevaare dat het bestuur hard nadenkt over de toekomstige strategie, maar dat de tijd nog niet rijp is om daar al iets over te zeggen.
"Tja", zou Martin Bril waarschijnlijk zeggen.

Laat ik dan proberen te schetsen hoe ik denk dat de NCDD moet gaan functioneren.
De keynote-speech van de conferentie werd gegeven door Abigail Potter van NDIIPP. Deze organisatie is min of meer de voorbeeld-organisatie voor de NCDD. Hier een mindmap van haar presentatie, die erg snel werd uitgesproken en vergezeld ging van erg volle sheets, dus het best mogelijk dat ik dingen gemist heb.



Twee dingen heb ik wel onthouden:
  1. NDIIP is neutraal. Hoewel opgericht door de Library of Congress, staat de organisatie daar eigenlijk los van. Hierdoor is ze voor alle partijen en belanghebbenden in Amerika geaccepteerd als partner en coördinator.
  2. NDIIP is gefocust op concrete samenwerkingsprojecten en speelt daarin vooral een coördinerende en faciliterende rol.
Dit zijn twee uitgangspunten die wat mij betreft ook voor de NCDD moeten gelden:
  1. Zorg dat je neutraal bent en ook zo gezien wordt.
    Het is voor mij dan dus de vraag of je zo nadrukkelijk moet aangeven wie de leden van de Coalitie zijn.
  2. Zorg dat je een echte coördinator kunt worden.
    Dat doe je door goed op de hoogte te zijn van wat verschillende organisaties in Nederland (en Europa) ontwikkelen en daarna in staat te zijn relevante partijen er toe te bewegen zaken gezamenlijk aan te pakken. Zorg dus dat je deskundige mensen in dienst heb, die dit kunnen realiseren.
Tenslotte nog twee verwijzingen:
Hier vind je de tweets en mindmaps die ik tijdens de conferentie verzonden heb.
Tweets NCDD 20090918

En hier vind je het radio-interview dat Inge aan Goedemorgen Nederland gegeven heeft voorafgaand aan de werkconferentie (vanaf 55:20)
Get Microsoft Silverlight