woensdag 9 juli 2008

Het ODA nader verklaard: toegankelijk en begrijpelijk (I)

In april was ik in de British Library in Londen bij What to preserve? Significant properties of digital objects, georganiseerd door JISC en DPC. Deze dag stond de vraag centraal welke eigenschappen van digitale bestanden bewaard moeten blijven om de toegankelijkheid en begrijpelijkheid van het digitaal bestand te verzekeren. Het leek soms een discussie tussen doven, omdat mensen er nog al verschillende definities op nahouden van wat ‘essentieel’ is. Dat zit natuurlijk ook al in de begrippen toegankelijk en begrijpelijk.
Toegankelijkheid lijkt mij vooral een technische aangelegenheid: bestanden moeten leesbaar zijn. Om dit mogelijk te maken, moet je bijvoorbeeld zorgen voor registers waarin de eigenschappen van bestandsformaten beschreven zijn, zodat je weet met welk programma je een bepaald bestand moet of kunt openen. Dit valt in ED3 onder de ‘representatie-informatie’ van een ODA en komt overeen met de eisen uit artikel 9 lid 1 sub a, b en c en sub d ten 5°, 6° en 8° uit de Regeling geordende en toegankelijke staat archiefbescheiden (RGTS).
Begrijpelijkheid blijkt een lastige term, omdat het per individu kan verschillen of hij iets begrijpt of niet. Dat hangt van de achtergrond van de ‘gebruiker’ af. Mede om die reden moet dus zo veel mogelijk van de ‘ontstaans- en gebruikscontext’ van de digitale objecten vastgelegd worden. In ED3 (en OAIS) zijn dit de gegevens die als de beheerinformatie bij een ODA moeten worden opgenomen.
De beheerinformatie bestaat uit vier onderdelen, die alle vier te herleiden zijn naar onderdelen uit de huidige RGTS:
Verwijzingsinformatie: de unieke kenmerken (“identifiers”) van de brongegevens, die het ODA identificeren in het depot. (In ED3 wordt hierbij verwezen naar RGTS artikel 9 lid 1 sub d ten 2°, 5° en 7°, maar dat lijkt me niet helemaal correct.)

Herkomstinformatie: informatie over de institutionele context van de brongegevens, waarin o.a. veranderingen qua inhoud, structuur en vorm en het beheersproces zijn opgenomen. Zie hiervoor ook RGTS artikel 8 lid 1 en 9 lid 1 sub d ten 1°, 3° en 7°.

Contextinformatie: informatie over de relaties tussen het ODA en zijn omgeving. Dit omvat naast de administratief-procedurele context ook de relaties met andere ODA’s. Zie ook RGTS artikel 9 lid 1 sub d ten 1°, 3° en 4°. Hier kan waarschijnlijk ook artikel 2 van de regeling bij betrokken worden, maar dit staat nu niet in ED3.

Integriteitsinformatie: informatie waarmee de fysieke integriteit van het ODA gecontroleerd kan worden. (De verwijzing in ED3 naar RGTS artikel 9 lid 1 sub d ten 2° en 7°, lijkt me bij nader inzien ook niet helemaal correct.)
En tenslotte is er ook nog de Verwijzingsinformatie, waarin gegevens uit de relatie-informatie (eventueel nog aangevuld met extra gegevens) zijn opgenomen, waardoor het mogelijk wordt de ODA’s in het depot te kunnen terugvinden. Dit komt grotendeels overeen met de ouderwetse inventaris en toegangen.

Ik vermoed dat er twee oorzaken zijn aan te wijzen voor de spraakverwarring in Londen (maar misschien ook wel eerder in Den Haag).
Allereerst het verschil tussen de technische en intellectuele essentie. In Londen besteedden de techneuten heel veel aandacht aan ‘technicalia,’ terwijl ik de indruk had dat de archivarissen zich in veel gevallen afvroegen of al die technicalia wel altijd relevant zijn. Hoe essentieel is het om te weten dat een Microsofts Word-bestand gekleurde letters kan bevatten, als er helemaal geen gekleurde letters in de tekst voor komen of als die kleur niet relevant is voor de begrijpelijkheid van het bestand?


En dan was er ook nog het verschil tussen archivarissen aan de ene kant en bibliothecarissen en ‘datamanagers’ aan de andere kant. Voor archivarissen ligt het zo voor de hand dat de context van een archiefstuk beschreven moet worden, dat we daar eigenlijk niet meer over nadenken (een ‘no brainer’, zoals Andrew Wilson zei). Dat doen we met 16e eeuwse akten, met een gemeentelijk archief uit de 20e eeuw en dus ook met digitale archieven. Het feit dat de RGTS ‘vol’ staat met dit soort eisen is in dit kader ook veelzeggend. Voor wetenschappers en bibliothecarissen lijkt dit beschrijven van de context een ‘nieuw’ concept te zijn. En dan blijkt ook dat archivarissen en ‘datamanagers’ verschillende termen voor het zelfde gebruiken of, wat misschien nog lastiger is, de zelfde termen voor verschillende begrippen hanteren. En het meest in het oog springend hierbij is misschien het begrip ‘authenticiteit.’ Hierop zal ik in een volgend bericht nog terugkomen.

In dit kader lijkt het introduceren van een nieuwe, specifiek op archieven gerichte terminologie, misschien niet het meest voor de hand liggend, maar ik denk dat Chido onze overwegingen duidelijk heeft uitgelegd.

Afbeelding: Michel Balasis

Geen opmerkingen:

Een reactie plaatsen