Warum Webseitenarchivierung?
Webseiten sind ein zentraler Bestandteil moderner Informations- und Verwaltungskultur – auch im Archivwesen. Sie verändern sich jedoch laufend oder verschwinden ganz. Inhalte, die heute noch verfügbar sind, können morgen schon offline sein.
Archive stehen deshalb vor der Herausforderung, öffentlich zugängliche Online-Inhalte dauerhaft zu dokumentieren – sei es als Ergänzung zu bestehenden Beständen, zur Dokumentation kommunaler Aktivitäten oder zur Langzeitarchivierung von Behördenseiten.
Die Lösung: Archivierung mit Heritrix
Mit dem Crawler Heritrix, entwickelt von der Internet Archive Foundation, bieten wir Ihnen eine professionelle und automatisierte Lösung zur Webseitenarchivierung. Wir erfassen komplette Webauftritte oder ausgewählte Seiten und liefern Ihnen die archivierten Daten in einem standardisierten Format.
Heritrix bietet:
- Tiefes Crawling dynamischer Webseiten
- Erfassung von HTML, Bildern, PDF-Dateien, Stylesheets und Skripten
- Speicherung im WARC-Format (Web ARChive), ideal für die Langzeitarchivierung
- Flexibel konfigurierbare Crawltiefe und -häufigkeit
- Optional: Abspielbare Webansicht (z. B. mit OpenWayback oder pywb)
Das Angebot auf einen Blick
Wir bieten Ihnen die komplette Dienstleistung aus einer Hand – von der Zieldefinition über das Crawling bis zur Datenübergabe.
Leistungsumfang:
- Beratung zu Zielseiten, Umfang und Crawl-Einstellungen
- Durchführung der Webseitenarchivierung mit Heritrix
- Lieferung der Archivdaten im WARC-Format
- Bereitstellung einer Wiedergabeumgebung oder Langzeit-Hosting
- Dokumentation und Nachweis für Ihre Archivverwaltung
Kosten: 950€ pro Jahr pro 1 TB Speicherverbrauch
- Die Speichergrößen von Webseiten von Gemeinden, Städten, Landkreisen und zugehörigen Einrichtungen sind sehr unterschiedlich und betragen in der Regel 10MB bis 5GB
- In der Praxis werden 1-2 Versionstände pro Jahr angefertigt.
- Auch bei großen Seiten sind mit 200 Versionsständen Lösungen möglich, die die Kosten langfristig überschaubar halten
Anwendungsbeispiele
- Archivierung kommunaler Webseiten
- Dokumentation von Wahlkampfseiten oder Veranstaltungen
- Übernahme von abgeschalteten Webpräsenzen
- Ergänzung von Arcinsys-Beständen durch archivierte Webinhalte
Vorteile für Ihr Archiv
- Kein technisches Know-how notwendig
- Einhaltung archivischer Standards (WARC, dokumentierte Workflows)
- Kombinierbar mit bestehenden Beständen
- Skalierbare Lösung – von Einzelseiten bis zu komplexen Webportalen