Eine interessante Frage für den Sonntag: Was soll eigentlich mit dem ganzen Zeug passieren, das im Internet steht? Den ganze Tweets, Facebook-Updates, privaten Homepages, Internetforen, und so weiter. Ist das alles Schrott, der schon irgendwann mal von selbst verschwinden wird? Oder sollte man sich darum kümmern, dass das alles irgendwie archiviert wird? Bei offline-Medien ist die Sachlage relativ klar. Ich erinnere mich noch gut, als ich in meiner Schule in Österreich an verschiedenen Schülerzeitungen mitgearbeitet habe und auch wenn da wirklich nichts von wahnsinniger Relevanz drin stand, mussten wir immer zwei Exemplare an die Österreichische Nationalbibliothek schicken, damit sie dort archiviert werden können (irgendwie ein grusliger Gedanken, dass mein „Red Bull Report“ aus dem Jahr 1993 jetzt immer noch dort nachlesbar ist…). Solange es auf Papier gedruckt ist, dann ist es offenbar auch wert, aufbewahrt zu werden. Bei immateriellen Daten allerdings ist die Sache nicht so klar. Hier gibt es zwar auch Archivierungsbemühungen, aber lange nicht so umfangreich und koordiniert wie in der „realen“ Welt. Und das was archiviert wird, ist irgendwie nicht mehr so wie das Original.

Die Frage nach der Archivierung und Archivierbarkeit des Internets ist auch das Thema der aktuellen Folge im PBS Idea Channel:

Geocities! Ja, da hatte ich Mitte bzw. Ende der 1990er auch meine ersten – und ziemlich absurden – Homepages. Die würde ich ja schon nochmal gerne sehen, und wenn es nur dazu dient, mich davor zu gruseln…

Aber das Thema ist ein ziemlich wichtiges Thema. Immer mehr Aktivitäten der Menschheit verlagern sich ins Internet und immer mehr wichtige Dinge passieren direkt dort. Wenn wir das nicht verlieren wollen, dann müssen wir uns darum kümmern. Und wenn, dann müssen wir alles aufheben, auch die ganzen „unwichtigen“ Tweets und Facebook-Einträge. Als die Menschen vor 100 Jahren alle ihre persönlichen Tagebücher auf Papier geschrieben haben, war das bei den meisten sicherlich auch nur „unwichtiges“ Zeug. Aber heute sind viele Forscher sehr glücklich darüber, dass dieses ganze Zeug von Bibliotheken, Instituten oder Privatleuten aufgehoben wurde – denn wenn die Tagebuchschreiberin etwas „bedeutendes“ geleistet hat, dann gibt es jede Menge Wissenschaftler und Biographen die gerne alles über ihr Leben erfahren wollen und ganz besonders an den scheinbar „unwichtigen“ Dingen interessiert sind. Und auch wenn der Tagebuchschreiber nur ein ganz normaler Mensch war, sind seine Einträge trotzdem interessant, weil die Welt eben hauptsächlich aus normalen Menschen besteht und auch ein historischen Interesse an deren Leben vorhanden ist.

Meine Uni-Homepage aus dem Jahr 1999 muss ob ihrer Genialität auf jeden Fall archiviert werden!!
Meine Uni-Homepage aus dem Jahr 1999 muss ob ihrer Genialität auf jeden Fall archiviert werden!!

Zukünftige Historiker und Biographen werden keine Tagebücher mehr auswerten, sondern Internetblogs, Facebookseiten und Twitter-Nachrichten. Bzw. sie werden es versuchen aber dabei vermutlich ziemlich oft scheitern, weil die entsprechenden Informationen verschwunden sind. Wenn die Daten im Internet verschwinden, dann verschwinden damit auch jede Menge Informationen über unsere Gesellschaft. Und diese Daten zu verlieren ist um nichts weniger tragisch, als wenn man zum Beispiel Bücher bei einem Bibliotheksbrand verliert. Es heißt zwar immer „Das Internet vergisst nichts!“. Aber wenn wir uns nicht darum kümmern, dann könnte genau das passieren.

(via bibliothekarisch.de)

57 Gedanken zu „Wie archiviert man das Internet? Und soll man das überhaupt tun?“
  1. Die Idee das Internet archivieren zu wollen, finde ich eher theoretisch. Praktisch ist das undurchführbar. Denn die Änderungen passieren ja pausenlos. So wie ich nicht den genauen Aufenthaltsort jeder einzelnen Ameise in einem Volk zu einem beliebigen Zeitpunkt archivieren kann.
    Es wird wohl nur so sein, das jeder Benutzer (des Internets) die ihm relevanten Daten lokal speichert. Ich habe von meinen aktuell gehosteten Webseiten Sicherheitskopien. Die werden regelmäßig erneuert und die alten Kopien gelöscht. Fertig. Und wenn keine meiner Seiten für die ‚Nachwelt‘ erhalten bleibt, so ist das im Grunde egal. Und das trifft für sicher mehr als 95% er Internetdaten auf. Sie sind evtl. für einzelne Menschen ‚wichtig‘ , aber für die Menschheit an sich irrelevant.
    Relevante Daten nur in einer Cloud zu speichern halte ich schlichtweg für verantwortungslos.

    1. @bikerdet: „Die Idee das Internet archivieren zu wollen, finde ich eher theoretisch. Praktisch ist das undurchführbar.“

      Ach, es ist nur ein Speicherplatzproblem. Und das sollte sich lösen lassen. Es gibt ja auch jetzt schon viele Bibliotheken, die automatisiert das Internet archivieren. Man müsste das halt nur koordinieren. Vielleicht mal die NSA fragen; die hat damit sicher Erfahrung.

      „Und das trifft für sicher mehr als 95% er Internetdaten auf. Sie sind evtl. für einzelne Menschen ‘wichtig’ , aber für die Menschheit an sich irrelevant.“

      Und genau das bezweifle ich. Wieso sollte das so sein? Man kann jetzt nicht sagen, was irgendwann für irgendwen relevant wird.

  2. Hmmm, interessanterweise geht die Teilchenphysik gerade den umgekehrten Weg.
    😉 Siehe das Buch von Lisa Randall (Kapitel 14):
    durch Trigger werden Ereignisse, die nichts neues erwarten lassen
    schon vor der eigentlichen Datenaufnahme verworfen.

    Auch bei den ganzen Tagebüchern: von den Aufzeichnungen der Leute vor 100 Jahren
    ist auch viel verloren gegangen. Sogar noch mehr, je weiter wir in der Zeit zurückgehen. Und wir können ganz gut damit leben.
    Oder ohne die verlorenen Schriften.
    Etwas Rauschunterdrückung ist auch ganz gut.

    Gibt es derzeit etwas brennend wichtiges, das nicht irgendwo archiviert ist?

    Ach ja, die Analyse der Daten: bei einem alten Dokument konnte man wenigstens anhand der Schrift untersuchen, ob es original ist. Bei elektronischen Daten
    ist das unklar. Wie soll man wissen, ob die Daten authentisch sind oder gefälscht
    (ok, bei Twitternachrichten glaube ich das nicht). Wenn die Herkunft der Daten sowieso nicht klar ist, kann man diese noch zuverlässig auswerten?

  3. Okay, die NSA wollte ich jetzt nicht ansprechen, damit hätte ich ja sakastisch antworten können : Wieso, wird doch pausenlos gemacht.
    Aber in Wirklichkeit ist es so, das das meiste im Internet überflüssig ist. Weltweit haben im Jahr 2012 etwa 2,4 Mrd. Menschen das Internet genutzt. Somit waren die Daten daraus für 65% der Menschen weltweit praktisch unbekannt. Auch wenn u.U. ihre Lebensumstände davon beeinflusst wurden, Zugriff auf die Inhalte hatten sie nicht.
    Und ohne jetzt anklagend zu werden, schaue Dir doch die Beiträge in Deinem Blog an. Wie viel davon wären es wert für unsere Nachkommen aufbewahrt zu werden ? Ich rede ausdrücklich nicht von Deinen Texten, sondern von unseren Kommentaren um das direkt klarzustellen. Natürlich ist es super hier mit, größtenteils , gleichgesinnten Leuten über ‚Gott und die Welt‘ diskutieren zu können. Es ist toll, das ängstlichen Fragern geholfen wird. Aber wollen diese es wirklich, das ihnen das in 10 oder 50 Jahren noch ‚auf’s Brot geschmiert‘ wird ?? Willst Du wirklich das Dich Deine (und uns unsere !) Jugendsünden ein Leben lang begleiten ? ‚Opa Florian, hast Du damals wirklich ….‘. Ich kann darauf verzichten, finde die fehlene ‚Archivierung des Internets‘ also Okay.

    1. @bikerdet: „Und ohne jetzt anklagend zu werden, schaue Dir doch die Beiträge in Deinem Blog an. Wie viel davon wären es wert für unsere Nachkommen aufbewahrt zu werden ? Ich rede ausdrücklich nicht von Deinen Texten, sondern von unseren Kommentaren um das direkt klarzustellen.“

      Wie gesagt: Du kannst JETZT nicht sagen, welche Daten in Zukunft wertvoll sind. Vielleicht kommt in 50 Jahren jemand auf die Idee, dass es enorm aufschlussreich sein könnte, zu untersuchen, wie Leute im deutschsprachigen Raum Anfang des Jahrhunderts über Wissenschaft diskutiert haben? Mir geht es nicht darum, „Jugendsünden“ verschwinden zu lassen oder mich zu ärgern, ob irgendwas peinlich ist. Texte sind Daten. Genau so wie heute Unmengen von Wissenschaftler alte Zeitungen, Bücher und Fernsehsendungen zu den verschiedensten Zwecken auswerten, machen das die Leute in der Zukunft wahrscheinlich auch mit den Daten die im Internet stehen. Und man KANN eben nicht wissen, was wichtig ist und was nicht. Ein Beispiel: Beim Citizien Science Projekt Old Weather werten Leute alte Logbücher von Schiffen aus um daraus mehr über das damalige Wetter und den Klimawandel zu erfahren. Damals hätte man sicherlich auch nicht gedacht, dass diese Logbücher Jahrzehnte später noch zu irgendwas zu gebrauchen sind. Heute sind wir froh, dass sie da sind weil man daraus Informationen bekommen kann, von denen wir früher gar nicht wussten, dass sie drin stecken. Und genau so ist eben auch mit den „überflüssigen“ Daten im Internet.

  4. und ganz ehrlich… meine ersten html-hopser bei AOL 🙂 das muss niemand mehr sehen… Ich denke auch – relevantes wird gesichert – Muttis Katzenfotos mögen in hundert Jahren mal kulturell interessant sein (wie – die haben sich früher Mäusefresser in der Wohnung gehalten???) – aber sonst…

  5. Hmmm, aber eigentlich hat das was.
    Vielleicht werden wir ja zitiert??

    In einer Abhandlung
    ‚Die Wahrnehmung des Internet im frühen 21. Jahuhundert, dargestellt anhand der Diskussion von bikerdet und Myscibco im Astrodicticum simplex…‘

  6. @Myscibco: „Wie soll man wissen, ob die Daten authentisch sind oder gefälscht […]. Wenn die Herkunft der Daten sowieso nicht klar ist, kann man diese noch zuverlässig auswerten?“

    Bei der Archivierung könnte man die Daten mit einer Hash-Funktion verarbeiten und so eine spätere Verifizierung ermöglichen. Ob die Daten dabei schon gefälscht waren oder nicht, sollte zunächst erst mal keine Rolle spielen. Der Inhalt von Zeitungsartikeln kann genauso gut falsch sein, trotzdem wird selbiger archiviert.

  7. Also wegen des Speicherplatzes braucht man sich wohl kaum Gedanken machen, auch wenn in Zukunft tatsächlich mal jeder Einzelne Internetzugang hat. Gerade sind die ersten 6TB Festplatten für den Massenmarkt erschienen, die SSD-Preise sind im freien Fall, und holographische Speicher sind zwar noch im Forschungsstadium, es ist jedenfalls kein Ende der Miniaturisierung in Sicht.

    Der interessantere Punkt ist, ob eben Blogkommentare, Forengespräche und Ähnliches auf Dauer archiviert werden sollen oder nicht. Das ist eine grundlegende Änderung in der zwischenmenschlichen Kommunikation, denn früher wurde ja auch nicht jedes Stammtischgespräch für die Nachwelt aufgezeichnet, und das war wohl auch gut so.

    Naja, von daher bin in in meiner Onlinekommunikation immer etwas vorsichtig, es könnte ja alles irgendwann gegen einen verwendet werden.
    Dies kann zu einer angenehmeren Umgangston führen, man muss aber auch aufpassen, dass man sich nicht selbst sozusagen einen Maulkorb umhängt.
    Jedenfalls schadet es bestimmt nicht, erstmal nachzudenken, bevor man was in Netz schreibt. Das gilt ja für die unmittelbare Kommunikation genau so, wird aber hier wie dort mitunter auch vernachlässigt.
    Bei meinen eigenen Daten verlasse ich mich jedenfalls nicht auf Cloudlösungen oder ähnliches, ein regelmäßiges eigenes Backup ist einfach Pflicht. Aus Heimcomputerzeiten habe ich da noch ein paar Listings auf Endlospapier, die ganzen alten Disketten habe allerdings mit ein wenig Wehmut neulich entsorgt…

  8. @ Florian :
    Okay, natürlich kann man nicht wissen, was in der Zukunft interessant ist. Aber das als Rechtfertigung für unbegrenzte Datenspeicherung zu nennen finde ich etwas heikel. Begründen nicht die Geheimdienste genau damit ihre Spionage ?

    1. @Bikerdet: Ja, der Datenschutz ist natürlich auch ein wichtiger Aspekt – denn sollte man aber extra diskutieren. Bis jetzt ging es ja um die Frage, ob es überhaupt sinnvoll ist, Daten aufzuheben oder nicht.

  9. @ stone1 :
    die ganzen alten Disketten habe allerdings mit ein wenig Wehmut neulich entsorgt

    Na ja, das hat die Nasa mit ihren Mondbändern auch tun müssen. Man hatte ‚plötzlich‘ festgestellt, das man weder ein kompatibles Bandgerät noch eine Abspielsoftware besaß. Die VT’ler habe gejubelt. So eine Vorlage bekommen die nicht jeden Tag. Allerdings hatte die Sternwarte Bochum noch original Mitschnitte und diese den Amerikanern zur Verfügung gestellt.

    Ansonsten kann man in der heutigen Zeit sagen, das alles was nicht auf Papier steht in wenigen Jahrzehnten ‚unlesbar‘ geworden ist. In den Serverfarmen werden die Daten ja auch nicht auf nur einem Medium archiviert, sondern pausenlos zwischen mind. drei Rechnern hin- und herkopiert. Die Gefahr, das ein Speichermedium kaputt geht und Daten unwiederbringlich zerstört werden ist einfach zu groß. Dies ist natürlich nur mit großen Kostenaufwand möglich und auch nur für begrenzte Datenbestände. Zig Mrd. Webseiten so zu konservieren ist unbezahlbar.

  10. holographische Speicher .. im Forschungsstadium

    Und zwar seit gefühlt hundert Jahren, stone1 – wie oft war ich kurz davor, jetzt aber ganz flott den Muster-Bestellschein auszufüllen… Um dann ein paar Tage später zu erfahren, daß das alles so fertig nun auch wieder nicht ist, von Tesa bis (etwas aktueller) Storex.

    die ganzen alten Disketten

    Da bin ich in der erfreulichen Lage, mich etwas loben zu können: Als der erste CD-Brenner lief, wurden die ca 3 Dutzend Diskettensärge durchforstet, gesichert und entsorgt (der Inhalt, ansonsten sind die Dinger im Keller-Regal noch im Einsatz)..
    Hat unheimlich viel gebracht, Großteil Assembler bis 360/370 runter und sonstige gleichwertig leicht portierbare Dinge^^

    btt: Selbstverständlich sollte alles eingelagert werden, was den spidern zugänglich gemacht wird (für Verweigerer gibts ja robots.txt). Wer maßt sich denn an, für alle Ewigkeit entscheiden zu können, daß Text xyz von niemandes Interesse sein wird?

  11. @bikerdet

    Na ja, das hat die Nasa mit ihren Mondbändern auch tun müssen. Man hatte ‘plötzlich’ festgestellt, das man weder ein kompatibles Bandgerät noch eine Abspielsoftware besaß.

    Sicher? Ich las mal von einem Projekt, wo in einem ehemaligen McDonalds-Gebäude alte NASA-Bänder auf moderne Datenträger kopiert werden. Muss aber nicht von Apollo gewesen sein.

  12. @rolak:
    Ach ja, Storex. Kommt denn die 10TB CD-ROM bald? 😉
    Ich meinte eigentlich das hier, wobei natürlich eine Minute Speicherdauer selbst in unseren schelllebigen Zeiten etwas kurz ist, aber das kann ja noch werden. Klingt jedenfalls nach potentiell revolutionärer Technologie.

    Jedenfalls sollte der Urheber eines Inhalts (oder ein Bevollmächtigter) diesen auch permanent löschen konnen, was natürlich das nächste Problem mit sich bringt, nämlich die eindeutige Identifizierung desselben, womit wir wieder bei NSA&Co landen.
    Es müsste eben so etwas wie eine vertrauenswürdige, nicht manipulierbare Überwachung der digitalen Welt geben, aber der Weg dahin ist noch weit und das Thema ein virtuelles Minenfeld, was wohl vor allem auch der weltweiten Geheimdienstarbeit (bzw. was davon öffentlich geworden ist) zu verdanken ist.

  13. @stone1: „Jedenfalls sollte der Urheber eines Inhalts (oder ein Bevollmächtigter) diesen auch permanent löschen konnen“

    Hmm, hmm. Das verstehe ich nicht. Warum sollte ein Artikel, Beitrag, Tweet, etc, der _frei_ im Netz verfügbar ist, aus einem Archiv, welches den alleinigen Zweck hat, öffentliche Texte zu archivieren, und sonst nichts, vom Urheber gelöscht werden dürfen? Darf man denn auch im Falle von Printmedien aus der Nationalbibliothek Artikel entfernen lassen? Das soll jetzt keine provozierende Frage sein, sondern ist ernst gemeint. Ich stelle mir so eine Möglichkeit recht problematisch vor.

    Beispielsweise würden dann auch Kommentare zu einem Online-Artikel keinen Sinn mehr ergeben, wenn der Originalartikel vom Urheber gelöscht worden wäre. Kompliziertes Thema, und es ist schon spät…

  14. bald?

    Immer die Woche danach, stone1

    waat ens e minüütche

    Nu ja, ein ziemlicher Fortschritt – der allerdings auch in diesem Ausmaß noch ein paar Mal notwendig ist, wenns in akzeptable Bereiche vorstoßen soll.
    Bei optischen Speichern denk ich jedoch zuerst an Bits/Volumen, Steigerung der Datendichte muß ja nicht unbedingt Hand in Hand gehen mit Steigerung der Haltbarkeit. Bei Letzterem gibt es wohl einen eindeutigen Marktführer.

  15. @ alderamin in #19 :

    In dem Bericht ging es explizit um die Mondmissionen. Die Bänder konnte man nicht mehr lesen, da man kein passendes Gerät hatte. Eigendlich ging es in dem Bericht um den Irformationsverlust durch neue Technologien. Selbstgebrannte CD sind nur ein paar Jahre lang lesbar, Disketten wurden schon unbrauchbar, wenn man die auf Lautsprecherboxen ablegte.
    Deshalb werden professionelle Backups eben auf Servern gemacht und permanent umkopiert. Dies hat auch den Vorteil, das ich auch permanent neue Daten einspeisen kann. Was nutzt z.B. einer Bank ein Backup von gestern ? Nichts, wenn alle Buchungen EINES Tages weg sind, ist die Bank am Ende. Schon eine Stunde verlorener Daten wäre eine Katastrophe.
    Und das selbe Prinzip müßte auch auf’s WWW angewand werden. Dazu bräuchte man dann dreimal so viele Server, wie bisher im Einsatz sind. Einer, der die Daten online hält, einer der speichert und eine Sicherungskopie. Wer will das tatsächlich machen ? Wo sollen all diese Server stehen, wer bezahlt dafür ? Wie sollen all die Daten überhaupt erfasst und katalogisiert werden ?
    Ich halte es für technisch unmöglich und auch völlig überflüssig. Wenn ich an alle die Seiten und Videos über Wünschelrutengänger und Wasserbeleber denke, es gibt Dinge die müssen wir nicht behalten.

  16. @bikerdet: “ Wenn ich an alle die Seiten und Videos über Wünschelrutengänger und Wasserbeleber denke, es gibt Dinge die müssen wir nicht behalten.“

    Fragen wir doch mal die Wünschelrutengänger und Wasserbeleber, wie die darüber denken…

  17. Die NSA fiel mir zu dem Thema auch zu erst ein, zumal es zu dem Thema vor einiger Zeit einen hübschen Dilbert gab:

    https://www.dilbert.com/2013-09-06/

    (Die Geschichte geht noch weiter, also ruhig auf das Pfeilchen nach rechts über dem Strip klicken … )

    Zum Thema wichtig oder unwichtig:

    Tagebücher wurden ja oben schon erwähnt.
    Eins der grössten Projekte zur Zeit ist die online-Stellung der Feldpost, Tagebücher etc. von ganz einfachen Soldaten aus dem 1. Weltkrieg.

    https://www.zeit.de/2014/02/erster-weltkrieg-internet-archiv-gedenkjahr

    Historiker lernen aus solchem Material von „einfachen Leuten“ oft viel mehr, als aus offiziellen Dokumenten, Statistiken, technischen Details über Waffen usw.

    Gerade das altägliche „Datenrauschen“ kann uns über eine bestimmte Zeit oft sehr viel sagen.

    Wir haben zB ein sehr genaues Bild davon, wie die Sumerer oder Babylonier vor 3000 Jahren gelebt haben, weil die buchstäblich jeden Sch… auf Tontafeln festgehalten haben.
    Millionen davon wurden in den letzten Hundert Jahren ausgegraben und sind ein unschätzbarer Wert wenn wir etwas über die Vergangenheit der Menschheit lernen wollen … auch wenn auf den meisten dieser Tafeln nur so Sachen stehen wie: „Zwei Krüge Wein getauscht für einen Ballen Leinen“.

    Zusammengenommen ergeben diese Alltagsaufzeichnungen nämlich ein viel genaueres Bild von den Verhältnissen Damals, als es hundert Hymnen auf irgendwelche Feldzüge von irgendwelchen Herrschern je könnten …

  18. @bikerdet:

    „Selbstgebrannte CD sind nur ein paar Jahre lang lesbar, Disketten wurden schon unbrauchbar, wenn man die auf Lautsprecherboxen ablegte.
    Deshalb werden professionelle Backups eben auf Servern gemacht und permanent umkopiert.“

    Oh ja! Punkt eins kann ich nur bestätigen. Ich habe diverse vor zehn Jahren gebrannte Musik CDs, die sich nirgendwo mehr abspielen lassen.
    Der zweite Punkt mit den Disketten ist allerdings eine Legende.
    Die magnetische Felddichte auf der Oberfläche der magnetisierbaren Schicht ist bei Disketten (und auch bei Kreditkarten o.ä.) so hoch, dass du schon einen Elektromageten von der Sorte bräuchtest, die ein Auto anheben können um da was zu löschen …

    Aber was ich eigentlich sagen wollte:
    Zum Thema Backup gilt eben, wie du ja auch angesprochen hast:

    Sysadmin Regel No. 8:
    „Nobody cares if you can backup. They only care if you can restore.“

    😉

  19. Hi,

    ich bin seit 1984 mit PC, später auch Internet aufgewachsen. Meine allerersten Programme (Magnetkarten für Taschenrechner und auch Bänder auf m Kasettenrecorder ) hab ich regelmäßig auf die neuesten Medien kopiert. Als dann Disketten durch CD´s ersetzt wurden, wurde das riesen Archiv auf einmal sehr übersichtlich. 😀

    Später dann DVD´s und inzwischen Terrabte Platte(n) für die ganzen Planetenbilder. Ich hab halt konsequent alles was mir wichtig war, archiviert. Und jetzt kam neulich ne Frage in meiner mailingliste auf, ob mann die aktuell stark sichtbaren Wolken auf Mars als Amateur früher auch gesehen hat. Also hab ich meine alten Bilder bzw. die Originaldaten rausgekruschtelt und neu bearbeitet. Siehe da, ja das kann man mit den heutigen Möglichkeiten auch aus den alten Daten rausfischen. Damals hab ich diese Details schlicht nicht gesehen, weil mit den früheren Möglichkeiten der Bildbearbeitung es noch nicht darstellbar war. 😀

    Meine emails von annudazumal hab ich auch noch größtenteils (leider sind 2 Jahre futsch, weil die Platte während einer Sicherung flöten ging) und hab schon öfters jemanden an seine alten Aussagen erinnern können …

    Ich finde, jeder ist für die archivierung seiner Daten selber zuständig. Ob er allerdings wirklich jedes Handyfoto für die Nachwelt aufhebt, ist Geschmackssache…

  20. @Uwe:
    Nun, ich bin der vielleicht altmodischen Meinung, dass so etwas wie ein Urheberrecht, auf welches man natürlich freiwillig verzichten kann, einen Sinn macht. Und das schließt auch mit ein, Aufzeichnungen zu vernichten, ein Künstler würde das vielleicht als notwendigen Teil eines kreativen Prozesses oder so ähnlich bezeichnen. Arnulf Rainer hat einige seiner Bilder beispielsweise schwarz übermalt (und manche kaufen oder leihen sowas dann auch noch um viel Geld, zum Beispiel unser Landesmuseum, versteh einer die Kunst – oder den Kunstmarkt 😉 ). Im Endeffekt geht es um die Entscheidungshoheit über die eigenen (oder eher selbst erstellten) Daten, ich bin strikt dagegen, diese aus der Hand zu geben, bei einer automatischen Archivierung müsste es also eine opt-out Regelung geben.

    Der Optimalfall ist natürlich, schon beim Hochladen eines Inhalts sicher zu sein, dass das sozusagen für die Ewigkeit für jeden sichtbar sein wird, der sich dafür interessiert oder zufällig darüber stolpert. Für mich selbst bin ich da einigermaßen guter Dinge, da ich nicht mehr völlig grün hinter den Ohren war, als das WWW größere Verbreitung fand, aber bei der Generation Facebook könnte ich mir durchaus vorstellen, dass der eine oder die andere später gerne mal etwas, das in vielleicht nicht ganz zurechnungsfähigem Zustand hochgeladen wurde, permanent aus dem digitalen Gedächtnis gelöscht haben will.

    @bikerdet:
    Wegen den Wünschelrutengängern und Wasserbelebern:
    Ich finde abschreckende Beispiele dürfen ruhig auch archiviert werden, sonst kann man nie etwas aus der Geschichte lernen. 😉

    Auf die Frage wer so etwas machen soll fällt mir eigentlich nur die UNO ein, aber solange nicht mehr als 50% der Weltbevölkerung Internetzugang haben, ist das Ganze eigentlich kein Thema, und wann hat die UNO auch jemals etwas auf die Schnelle gebacken bekommen?

    Das Internet ist ja im Grunde auch noch eine ziemlich junge Technologie, die einige Schwächen hat, sonst gäbe es beispielsweise die derzeitige Sicherheitsdebatte gar nicht.

    Das Internet Protocol 6 bringt einige Fortschritte, die NSA-Affäre kurbelt die Sicherheitsmaßnahmen an, und wahrscheinlich ist es nur eine Frage der Zeit, bis ein mehrstufiges dezentrales automatisches Backup des gesamten Internets mehr oder weniger ins System implementiert wird.
    Was Apple mit seiner Timeline vorgemacht hat, wird man für das Internet eines Tages auch hinkriegen, das diesjährige Cebit-Motto „Datability“ (ich denk da immer an eine Schmalzlocke 😉 ) zeigt ja, dass Big Data nicht aufzuhalten sein wird.

    Bis dahin müssen wir halt unseren Sysadmins vertrauen oder das, was uns wichtig ist, selbst archivieren, auch wenn das mitunter recht zeitaufwendig sein kann – ich bin grad dabei, die Archivierung meiner optischen Mediensammlung abzuschließen, da kommt bei einem Musikfan schon einiges zusammen, und die CDs wechseln sich leider nicht von selbst.

  21. @stone1:

    „Nun, ich bin der vielleicht altmodischen Meinung, dass so etwas wie ein Urheberrecht, auf welches man natürlich freiwillig verzichten kann, einen Sinn macht.“

    Wenn, dann meinst du die Verwertungsrechte.
    Auf sein Urheberrecht kann man in D-Land (und auch in vielen anderen Industrieländern) aus gutem Grund nicht verzichten …

    „Bis dahin müssen wir halt unseren Sysadmins vertrauen [..]“

    You can trust us! Were the good guys! 😉

  22. @PDP10:
    Danke für die Korrektur, das stimmt natürlich, entschuldige den Schlendrian, ist auch schon spät und der Kommentar ist länger geworden als gedacht, und es ist auch schon spät. Die Zeitumstellung macht mir wohl schon zu schaffen, bevor ich morgen wieder raus muss. Das ist mal eine Sache, wo scheinbar letzten Endes noch die UNO eingreifen muss, damit das dämliche Uhrenumstellen ein Ende findet! 😉

  23. Das Internet archivieren: Gilt das auch für die Porno-Seiten (ein erheblicher Anteil des Internets) und ähnlichem?

    Heutzutage freut man sich über (wenige) Tontafeln alter Kulturen (etwa der Sumerer), welche Handelstransaktionen dokumentieren. Aber gleich alle?

    Ich halte mich da an die Regeln des Finanzamtes: Die letzten 7 Jahre archiviere ich, alles andere kommt in den Schredder. Es ist einfach nur Informationsmüll.

    Alles was das Internet an Informationen anbietet findet man im wesentlichen auch in Druckmedien und die werden bereits archiviert. Ich halte die Archivierung des aktuell vorhandenen Internets für überlüssigen Unfug.

    Einzig interessant in diesem Zusammenhang erscheint mir die zugrundeliegende Informatik. Aber auch das ist natürlich bereits Länge mal Breite dokumentiert.

    1. @sowhat: “ Gilt das auch für die Porno-Seiten (ein erheblicher Anteil des Internets) und ähnlichem?“

      Warum nicht? Was glaubst du, wie begeistert die Historiker wären, könnten sie sich ein paar alte sumerische Pornos ansehen… auch das sind Daten.

  24. Ich gebe Florian vorbehaltlos recht, dass das Internet genauso archiviert werden sollte (mit dem Vorbehalt, dass jeder in der Lage ist, gewisse Daten endgültig vernichten zu können).

    Warum ?

    Weil es für Historiker und nachfolgende Generationen von unschätzbarem Wert ist, zu verstehen, wie wir gedacht und gelebt haben.

    Stellen wir uns vor, wir hätten die Tagebücher von Ägyptern vor 3000 Jahren. Wie ist jemand aufgewachsen, ab wann mußten die Kinder arbeiten, wie zufrieden waren die Leute mit ihrem Leben. Was haben sie wirklich gedacht, wie kamen sie zu ihren Schlüssen ? Was haben sie gewußt, was wurde als normal empfunden ? (Wenn etwas bestraft wurde, wissen wir, dass es vorkam und als verwerflich angesehen wurde !) Was war wichtig in ihrem Leben, wie haben sie auf Krisen reagiert ?

    Wir erleben nämlich immer mehr, dass Generationen ein Bild vorgeführt bekommen, dass aufgrund guter Absichten andere Generationen komplett realitätsverzerrt abbildet und es damit unmöglich macht, Leute aus anderen Epochen zu verstehen. Insbesondere werden unbewußt Widersprüche eingeführt.

    Stellen wir uns vor, alte Aufzeichnungen und Tagebücher würden vernichtet und wir hätten nur alte Filme zur Verfügung. Dann sehen wir
    – die Menschen damals haben unverschämt gut ausgesehen.
    – Schwarze, Indianer und Frauen spielen in Filmen Hauptrollen, aber in anderen Filmen werden sie als unterdrückt dargestellt und viele grausame Sachen mit Ihnen angestellt. Merkwürdig.
    – Der Wilde Westen verfügte über rauchlose Revolver, die Leute sind hauptsächlich durch die Gegend geritten und haben andere Leute abgeschossen.

    etc. pp.

    Die Tagebücher anderer Menschen in den Weltkriegen z.B. liefern uns Informationen, was die Menschen wirklich gedacht haben, auch wenn es uns nicht gefällt.
    Wir jetzt z.B. senden Nachrichten zu jeder Tages- und Nachtzeit. Die Menschen später verstehen, dass Sonntag nicht nur ein nomineller freier Tag war, sondern tatsächlich auch so genutzt wurde. Die Wissenschaftsblogs enthalten Menschen, die tatsächlich der Meinung sind, dass vieles nicht gespeichert werden soll, insbesondere das, was man damals als Pseudowissenschaft verstand. Über dieses Thema wird häufig gestritten, es scheint also wichtig zu sein. Wissenschaftsblogs sprechen nicht nur über Wissenschaft, sondern auch über Politik etc. pp. Die Autoren haben dann und da freigenommen oder waren unterwegs (Wohin ? Wozu ?).
    Warum haben wir die drohenden Umweltkatastrophen nicht aufgehalten ? Warum hat sich niemand gegen die NSA gewehrt ? Was sind unsere Erfolge, wo haben wir versagt ? Und warum ?

  25. Aus meiner Sicht gibt es einen ganz sachlichen Grund für die Archivierung von Webseiten: das Gesetz. Ich arbeite an der Sächsischen Landesbibliothek (SLUB) (schreibe hier aber explizit als Privatperson!) und bin daher dem Sächsischen Gesetz über die Presse (SächsPresseG) unterworfen (https://www.slub-dresden.de/fileadmin/groups/slubsite/Ueber_uns/PDF-Ueber_uns/Pressegesetz.pdf). §11 regelt die Ablieferungspflicht von Publikationen und schließt seit 2014 auch explizit digitale Publikationen mit ein. Darin sind u. a. auch Webseiten aus und über Sachsen mit eingeschlossen.

    Die SLUB hat also den gesetzlichen Auftrag, auch elektronische Publikationen in ein Langzeitarchiv aufzunehmen, das sich derzeit im Aufbau befindet. Dabei müssen die gespeicherten elektronischen Publikationen nicht nur abgespeichert werden, sondern regelmäßig aktuelle Abzügen von z. B. Websites gemacht werden und alle gespeicherten Dateien regelmäßig auf aktuelle Speichermedien und in lesbare Formate migriert werden. Damit soll gewährleistet werden, dass die Dateien nicht beschädigt werden (bitstream preservation) und die Formate langfristig interpretierbar bleiben (content preservation).
    Derzeit stehen weltweit viele Institutionen (Archive, Bibliotheken, Forschungsinstitute, private Sammler u.v.a.m.) vor der Herausforderung, digitale Langzeitarchive aufzubauen. Bisher gibt es dazu jedoch kaum Erfahrungswerte, so dass insbesondere die Archivierung von Webseiten momentan noch problematisch ist und in der konzeptionellen Phase steckt. WARC scheint hier ein vielversprechender Container zu sein.

    Zum Weiterlesen:
    LZA an der SLUB Dresden https://www.slub-dresden.de/ueber-uns/digitale-langzeitarchivierung/
    LZA an der BSB München https://www.babs-muenchen.de/

    1. @Jörg: „Darin sind u. a. auch Webseiten aus und über Sachsen mit eingeschlossen. „

      Das klingt interessant. Wie wird das denn konkret umgesetzt? Werden alle Websiten die sich auf Servern irgendwo in Sachsen befinden archiviert? Und wie bestimmt man das konkret (Diverse Lokalisierungsdienste halten meinen PC, der ja in Jena steht, oft für einen Rechner in Chemnitz – keine Ahnung warum…)? Und wie findet man heraus, welche Homepages sich mit „sächsischen Themen“ beschäftigen? Würde das hier dazu gehören? https://scienceblogs.de/astrodicticum-simplex/2011/08/26/ausflugstipp-der-planetenweg-von-bad-schlema-und-schneeberg/ Oder sowas hier: https://scienceblogs.de/astrodicticum-simplex/2013/10/26/hallo-zeitumstellung-abenteuer-am-15-meridian/

      Ich stelle mir das in der Praxis ziemlich kompliziert vor. Gibt es da spezielle Mitarbeiter/eine spezielle Ausbildung für diese digitale Archivierung? Ist auf jeden Fall eine faszinierende Sache! (Hmm – ich könnte ja einfach mal nach nebenan in die Thulb gehen und schauen, ob dort jemand Zeit für ein Interview hat…)

  26. @Florian:
    Die Geolocation über die IP-Adresse ist nicht sehr genau, vermutlich sitzt der Provider, von dem Dein Rechner diese Adresse bezieht, in oder in der Nähe von Chemnitz. Da diese Adressen dynamisch bei jedem Einloggen (und oft auch nach einer bestimmten Frist) neu vergeben werden, wäre es recht aufwändig, jedes mal einen genauen Standort mitzudefinieren, deshalb wird meist eben der Einwahlpunkt beim Provider als Geographische Lage für alle dynamischen Adressen, die dieser vergibt, verwendet.
    Man kann auch eine fixe IP-Adresse mit genauer Position erwerben, aber das ist relativ teuer und lohnt sich eigentlich nur für Firmen.
    Weitere Erläuterungen zum Thema sind beispielsweise hier zu finden.

  27. Es ist hier ja schon geschrieben worden, aber nochmal zur Bekräftigung: Die Archivierung des Internets wäre für zukünftige Historiker ein Traum! Eine solche heterogene Quellensituation gibt es ansonsten nirgends. Die Beurteilung bzgl. der Bedeutung und Relevanz einzelner Beiträge darf man Historikern ruhig zutrauen. Die Regeln der historischen Wissenschaft sind durchaus genau (ich weiß, einige Naturwissenschaftler bezweifeln das;-) Aber tatsächlich sind sich Historiker der partiellen Unzulänglichkeit ihrer Wissenschaft sehr wohl bewusst!).

    Im Allgemeinen wird unter Historikern befürchtet, dass unsere heutige Zeit, aufgrund der „Flüchtigkeit“ digitaler Informationen, eines Tages als ein blinder Fleck in der Menschheitsgeschichte dastehen wird. Was als ein krasser Widerspruch dazu erscheint, dass man im Moment in einem Informationszeitalter lebt, in dem man über alles und jeden etwas finden kann (ja, und auch Pornos haben ihre historische Relevanz….)

    @Florian:
    Was mich interessieren würde: Sammelst Du Deine Blogbeiträge zur Sicherheit auch noch „analog“, bzw. als Ausdrucke in Ordnern oder so? Mir ist dieses permanente übertragen von altem Computer auf neuen schon zuviel. Papier ist einfach der beste Datenträger, wie ich finde!

    1. @Frank: „Was mich interessieren würde: Sammelst Du Deine Blogbeiträge zur Sicherheit auch noch “analog”, bzw. als Ausdrucke in Ordnern oder so?“

      Ne…

  28. @rolak

    Ich hab da einen Kollegen, naja, eigentlich ist er mein Chef, der liest Emails prinzipiell erst nachdem er sie ausgedruckt hat.

    Originalaussage: „Mein Drucker funktioniert nicht, wie soll ich meine Emails bearbeiten?“

    😉 ….

  29. Emails

    ..im Büro, das ist nichts Besonderes, Liebenswuerdiges Scheusal, läuft bei uns genauso nach hundertjähriger Tradition: Eine Kopie in die Mappe. Wenn ich es recht verstanden habe, ist der trotz des Aufwands schützenswerte Vorteil, daß man dadrauf rumkrakeln kann.

  30. „Spätestens bei youporn wird man scheitern…“

    Wenn man nur die Vorschaubildchen als ASCII-Art ausdruckt, sollte das zu machen sein … 😉

  31. @Liebenswürdiges Scheusal:

    Nicht nötig. Jibbet schon. Sogar als Online Tool:

    https://www.network-science.de/ascii/

    Jetzt müsste man nur noch so ein Tool nehmen, und dann per wget sämtliche Vorschaubildchen runterladen … 🙂

    Wobei ich ehrlich gesagt glaube, dass das mit den Pornos von den meisten Leuten schwer überschätzt wird.

    Die grössere Herausforderung wird wahscheinlich YT sein.

    Laut letzter Statistik werden da pro Minute ca. 100 Stunden Video-Material hochgeladen.

    Das zu archivieren, geschweige denn auszudrucken, ist mal eine echte Herausforderung!

    (Und wer zur Hölle soll sich das eigentlich alles ansehen?!?)

  32. Gestern ist mir noch was untergekommen, dass zwar nicht zur Internetarchivierung taugt, dafür kann man sich dort Daten in analoger Form für die absehbare Ewigkeit einlagern lassen.
    Auf Keramikplatten in einem ehemaligen Salzstollen in Österreich.

  33. @PDP10
    https://www.network-science.de/ascii/

    Super link. Hab ihn gleich ausprobiert 🙂

    ___ ___ ___ ___
    /\ \ /\__\ /\ \ /\__\
    /::\ \ /:/ / /::\ \ /:/ /
    /:/\:\ \ /:/ / /:/\:\ \ /:/__/
    /::\~\:\ \ /:/ / ___ /:/ \:\ \ /::\__\____
    /:/\:\ \:\__\ /:/__/ /\__\ /:/__/ \:\__\ /:/\:::::\__\
    \/__\:\ \/__/ \:\ \ /:/ / \:\ \ \/__/ \/_|:|~~|~
    \:\__\ \:\ /:/ / \:\ \ |:| |
    \/__/ \:\/:/ / \:\ \ |:| |
    \::/ / \:\__\ |:| |
    \/__/ \/__/ \|__|

  34. ___ ___ ___
    /\ \ /\__\ /\ \
    /::\ \ /:/ / /::\ \
    /:/\:\ \ /:/ / /:/\:\ \
    /::\~\:\ \ /:/ / ___ /:/ \:\ \
    /:/\:\ \:\__\ /:/__/ /\__\ /:/__/ \:\__\
    \/__\:\ \/__/ \:\ \ /:/ / \:\ \ \/__/
    \:\__\ \:\ /:/ / \:\ \
    \/__/ \:\/:/ / \:\ \
    \::/ / \:\__\
    \/__/ \/__/
    ___
    /\__\
    /:/ /
    /:/__/
    /::\__\____
    /:/\:::::\__\
    \/_|:|~~|~
    |:| |
    |:| |
    |:| |
    \|__|

  35. .:::::::: .:: .:: .:: .:: .::
    .:: .:: .:: .:: .:: .:: .::
    .:: .:: .:: .:: .:: .::
    .:::::: .:: .:: .:: .: .:
    .:: .:: .:: .:: .:: .::
    .:: .:: .:: .:: .:: .:: .::
    .:: .::::: .:::: .:: .::

  36. Um nochmal auf das Thema Sex und die Archivierung des Internets zurück zukommen: Heute lief auf ZDF.info eine Reportage mit dem Titel „Sex in der Steinzeit“. In der Mediathek ist sie (noch) abzurufen unter:
    https://www.zdf.de/ZDFmediathek/kanaluebersicht/aktuellste/398#/beitrag/video/2127194/Sex-in-der-Steinzeit

    Also wenn die Menschen damals schon Internet so wie wir heute gehabt hätten, und alles währe archiviert worden, dann hätten es die Forscher heute wohl tatsächlich einfacher gehabt… 🙂

Schreibe einen Kommentar zu bikerdet Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.