Sperrung des Internet Archive: Gefahr für die Web-Geschichte

Was mit dem Zugang zum Internet Archive passiert

The New York Times hat begonnen, das Internet Archive mit technischen Maßnahmen vom Crawlen ihrer Website auszuschließen, die über traditionelle robots.txt-Regeln hinausgehen. Andere Zeitungen wie The Guardian scheinen diesem Ansatz zu folgen. Diese Blockade gefährdet den Zugang zu historischen Webaufzeichnungen, auf die Journalisten, Forscher und Gerichte seit Jahrzehnten angewiesen sind.

Warum das für die historische Bewahrung wichtig ist

Das Internet Archive betreibt die Wayback Machine, die mehr als eine Billion archivierte Webseiten enthält. Seit fast dreißig Jahren bewahrt es Nachrichtenseiten so, wie sie ursprünglich online erschienen sind. Wenn Artikel bearbeitet, geändert oder entfernt werden, wird das Archiv oft zur einzigen Quelle, um diese Originalversionen zu sehen. Wenn große Verlage diese Crawler blockieren, beginnt der historische Bestand zu verschwinden.

Der KI-Zusammenhang und der rechtliche Kontext

Verlage nennen Bedenken hinsichtlich KI-Unternehmen, die Nachrichteninhalte abschöpfen, als Motivation für die Blockade des Archivs. The New York Times und andere verklagen KI-Unternehmen wegen der Frage, ob das Trainieren von Modellen mit urheberrechtlich geschütztem Material gegen das Gesetz verstößt. Das Internet Archive baut jedoch keine kommerziellen KI-Systeme auf – es bewahrt historische Aufzeichnungen. Der Artikel argumentiert, dass die Blockade gemeinnütziger Archivare die falsche Reaktion auf KI-Trainingsbedenken ist.

Aus rechtlicher Sicht ist die Durchsuchbarmachung von Material als Fair Use anerkannt. Gerichte haben anerkannt, dass der Aufbau durchsuchbarer Indizes oft das Erstellen von Kopien des zugrundeliegenden Materials erfordert. Als Google ganze Bücher kopierte, um eine durchsuchbare Datenbank zu erstellen, erkannten Gerichte dies als Fair Use an, da es dem transformativen Zweck diente, Entdeckungen und Forschung zu ermöglichen. Dieselben Prinzipien gelten für die Webarchivierung.

Praktische Auswirkungen auf Forschung und Journalismus

Wikipedia allein verlinkt auf mehr als 2,6 Millionen Nachrichtenartikel, die im Internet Archive erhalten sind und 249 Sprachen umfassen. Unzählige Blogger, Forscher und Reporter sind auf das Archiv als stabile, autoritative Aufzeichnung dessen angewiesen, was online veröffentlicht wurde. Wenn große Verlage den Zugang weiter blockieren, könnten zukünftige Forscher feststellen, dass bedeutende Teile der Webgeschichte verschwunden sind.

📖 Read the full source: HN AI Agents

Internet-Archive-Sperrung gefährdet die Bewahrung der Web-Geschichte

Was mit dem Zugang zum Internet Archive passiert

Warum das für die historische Bewahrung wichtig ist

Der KI-Zusammenhang und der rechtliche Kontext

Praktische Auswirkungen auf Forschung und Journalismus

👀 Siehe auch

Apple bietet kostenloses Private Cloud Computing für Indie-Entwickler mit unter 2 Millionen Downloads an

OpenClaw-Client fügt Kostenverfolgung und Ausgabenlimits pro Agent hinzu

Mercor-Datenleck: 4 TB an Sprachproben + Ausweisen gestohlen – Was Angreifer jetzt tun können

Drei inverse Gesetze der Robotik: Menschliche Leitlinien für die KI-Nutzung