WARC: het fundament van een duurzaam webarchief

Eind vorig jaar organiseerden we een borrel. Een gezellige groep online professionals van de overheid hief met ons het glas. Het ging, behalve over de geserveerde rendang-kroketjes, ook opvallend vaak over één onderwerp: WARC-bestanden. Niet echt een onderwerp waarmee je doorgaans aan de bar hoge ogen gooit, zou je denken. Maar deze keer was het anders! Wat wij er in ieder geval van opstaken is dat veel webspecialisten bij de overheid nog niet helemaal scherp hebben wat WARC is en waarom ze WARC-bestanden nodig hebben. Dat geeft natuurlijk helemaal niks. Dip is er om je te helpen, met…. DE DEMYSTIFICATIE VAN HET WARC-BESTAND.
WARC uitgelegd
In een webarchief kun je zien hoe websites er vroeger uitzagen. Een WARC-bestand (Web ARChive) is een momentopname van een website op een bepaalde dag in het verleden. Stel je een diaprojector voor met een magazijn waarin meerdere dia’s zitten. Elke dia is een WARC-bestand. Door de dia’s achter elkaar af te spelen, zie je de veranderingen van de website over tijd. Om ervoor te zorgen dat de dia’s met elke projector ter wereld te bekijken zijn, is het van belang dat de dia’s een uniform formaat hebben en altijd op dezelfde wijze bekeken kunnen worden. Voor WARC-bestanden is deze uniformiteit gegarandeerd door de ISO 28500 standaard. Deze standaard zorgt ervoor dat elk WARC-bestand overal bekeken kan worden – vandaag, maar ook over 10 of 100 jaar.
Wettelijk verplicht
Een webarchief kan je dus zien als een verzameling WARC-bestanden die tezamen de geschiedenis van een website vastleggen. En dat is niet alleen maar leuk om te weten voor de volgende borrel, als online of archiefspecialist bij de overheid krijg je ermee te maken. Het is namelijk wettelijk verplicht om overheidswebsites in een “goede, geordende en toegankelijke staat te bewaren”. Ons Nationaal Archief heeft in de Richtlijn archiveren overheidswebsites vastgelegd dat dit voor websites moet gebeuren in WARC-bestanden.
Uitwisselbare standaard
Net zoals dia’s gemaakt zijn om in elke diaprojector te passen, is een WARC-bestand gemaakt om in elke archief-omgeving bekeken te worden. Bijvoorbeeld de archief-omgeving van jouw webarchief-dienst of de archief-omgeving van het e-Depot van jouw organisatie of jouw regionaal archief. Dit uitwisselbare karakter wordt mogelijk gemaakt door de internationale standaard (ISO 28500) waaraan WARC-bestanden volgens de richtlijn van het Nationaal Archief moeten voldoen. De WARC-standaard garandeert dat webarchieven niet vastzitten aan een specifieke leverancier of technologie, waardoor ze duurzaam toegankelijk blijven, ongeacht de ontwikkeling van de techniek in de toekomst.
Jouw website, jouw WARC-bestanden
Naast het maken van een goed webarchief in de vorm van WARC-bestanden, is het ook van belang dat je zelf altijd en kosteloos toegang hebt tot deze WARC-bestanden. Immers, deze bestanden bevatten jouw data en je hebt deze bestanden nodig om ze over te kunnen dragen naar een permanente bewaarplaats, zoals een e-Depot. Pas dan is het volledige proces van archivering voltooid. Helaas is het niet bij elke webarchief-dienst even gemakkelijk om de WARC bestanden van jouw websites te ontvangen. Vaak moeten hier vele duizenden euro’s voor betaald worden. Bij dip vinden we dat jouw data van jou is en dat je er altijd en zonder kosten bij kan. De webarchieven van dip kan je dus altijd zonder problemen oppakken om bij een andere leverancier of in een e-depot onder te brengen. Precies zoals het hoort.
Wil jij genieten van een diavoorstelling? We laten je onze oplossing graag een keer zien: https://www.digitalinsightsplatform.nl/webarchivering
