vrijdag 3 juli 2009

Digital Preservation - The Planets Way (2)

Een van de doelstellingen van de bijeenkomst in Kopenhagen was om belanghebbenden en geïnteresseerden te informeren over de dingen die binnen PLANETS ontwikkeld worden. Vandaag een overzicht van een paar kleine dingen. Later volgen nog het Testbed en het Interoperability Framework waar alles uiteindelijk in samen moet komen.

Migratie van relationele databases
Voor het bewaren van relationele databases ontwikkelt het Schweizeris Bundesarchiv het SIARD-formaat.
Het probleem bij relationele databases zit hem in de relaties. Als je een database migreert moet je die relaties in stand zien te houden, want anders is de 'inhoud' van de database bijna waardeloos. Om dit te bewerkstelligen is SIARD ontwikkeld: Software-Independent Archiving of Relational Databases, waarmee Oracle, MS SQL en MS Access databases duurzaam bewaard kunnen worden.
Een SIARD-bestand is een container (zip64) met verschillende xml-bestanden. Voor iedere tabel in de database wordt een apart xml-bestand gemaakt, waarin de inhoud van de tabellen is opgenomen. Daarnaast wordt een metadata.xml gemaakt waarin de metadata (gebaseerd op SQL 1999) zijn opgenomen.

Uit de presentatie van Jean Marc Comment van juli 2008 maak ik op dat er drie applicaties ontwikkeld worden:

SiardFromDb extraheert en conveert de inhoud van een relationele database naar het SIARD-formaat.
SiardEdit is bedoeld voor het toevoegen en wijzigen van metadata
SiardToDb plaatst een SIARD bestand weer in een database instance en maakt het zoeken en navigeren in de database mogelijk.


Emulatie
Ik heb het hier al eerder gehad over emulatie en mijn bedenkingen bij deze techniek. In PLANETS is Dioscuri, de modulaire emulator van KB en NA waarop MS-DOS, FreeDos, LINUX 16-bits (ELKS) en MS Windows 3.0 kunnen draaien, verder ontwikkeld. Hier staat een uitgebreid verslag van vijf case studies met Dioscuri.
Een van mijn bezwaren tegen Dioscuri (en tot nu toe tegen emulatie in het algemeen), is dat het nogal wat technische kennis vergt om een emulator werkend te krijgen. En voor ieder hardware-platform moet je een aparte emulator bouwen. Daar hopen ze in PLANETS door middel van GRATE een oplossing voor te vinden. GRATE (Global Remote Access To Emulation) biedt "Emulation as a Service". Het zou als volgt moeten gaan werken en dit is de simpele uitleg, technisch zitten er nog wat haken en ogen aan:

Stel je hebt een Ami Pro bestand en je wil dit in de 'orgininele configuratie' bekijken. Dan upload je het bestand naar de GRATE-website, waar met behulp van PRONOM en de Planets Core Registry (zie beneden) bekeken wordt welk bestandsformaat het is en op wat de beste manier is om het bestand te tonen. GRATE levert dan een URL en door daar op te klikken, verschijnt in je browser Ami Pro in Windows 98!

 

Natuurlijk heb je dan nog altijd het probleem dat je moet weten hoe Ami Pro werkt, maar, vroeg Maureen Pennock zich tijdens de presentatie af, is dat niet vergelijkbaar met het kunnen ontcijferen van oud-schrift?

Planets Core Registry
Het laatste wat ik hier wil noemen is eigenlijk geen 'klein ding' maar het hart van PLANETS: de Core Registry.
Bij The National Archives in Londen hebben ze enige tijd geleden PRONOM ontwikkeld. Dit is een (online) register waarin allerlei gegevens over bestandsformaten worden bij gehouden, bijvoorbeeld over Word 6.0

De Core Registry wordt een uitbreiding van PRONOM, doordat het niet alleen informatie bevat over bestandstypen, maar ook over software(applicaties), hardware en media en 'preservation pathways'. Dit zijn een soort stappenplannen voor het bewaren van bepaalde bestandsformaten. In de Core Registry wordt bijvoorbeeld opgenomen met welke emulator Ami-pro bestanden het beste geraadpleegd kunnen worden, waardoor GRATE deze kan opstarten. Of in de Registry wordt bijvoorbeeld (op basis van Testbed-resultaten) opgenomen dat gif-bestanden het beste via jpg naar png gemigreerd kunnen worden, inclusief welke applicatie daar het meest geschikt voor is. Op basis hiervan kan dan in PLATO de juiste bewaarstrategie gekozen worden.


Wordt nog één keer vervolgd...

2 opmerkingen:

  1. Ingmar,
    Mag ik de Core Registry zien als een soort Digital Rosetta Stone a la http://www.ercim.org/publication/ws-proceedings/DELOS6/rosetta.pdf ?

    BeantwoordenVerwijderen
  2. @Chido: zie voorlopig dit.
    Ik moet het DRS-stuk nog lezen.

    BeantwoordenVerwijderen