Угроза блокировки Internet Archive ставит под угрозу сохранение истории веб-пространства.

✍️ OpenClawRadar📅 Опубликовано: 21 марта 2026 г.🔗 Source
Угроза блокировки Internet Archive ставит под угрозу сохранение истории веб-пространства.
Ad

Что происходит с доступом к Internet Archive

The New York Times начала блокировать Internet Archive от сканирования своего веб-сайта с помощью технических мер, выходящих за рамки традиционных правил robots.txt. Другие газеты, включая The Guardian, похоже, следуют этому подходу. Такая блокировка рискует лишить доступа к историческим веб-записям, на которые десятилетиями полагались журналисты, исследователи и суды.

Почему это важно для исторического сохранения

Internet Archive управляет Wayback Machine, которая содержит более одного триллиона сохранённых веб-страниц. Почти тридцать лет она сохраняет новостные сайты в их первоначальном онлайн-виде. Когда статьи редактируются, изменяются или удаляются, Архив часто становится единственным источником для просмотра этих оригинальных версий. Блокировка этих краулеров крупными издателями означает, что историческая запись начинает исчезать.

Ad

Связь с ИИ и правовой контекст

Издатели ссылаются на опасения по поводу скрапинга новостного контента компаниями ИИ как на мотивацию для блокировки Архива. The New York Times и другие подают в суд на компании ИИ по вопросу о том, нарушает ли закон обучение моделей на защищённом авторским правом материале. Однако Internet Archive не создаёт коммерческие системы ИИ — она сохраняет исторические записи. В статье утверждается, что блокировка некоммерческих архивистов — это неправильная реакция на опасения по поводу обучения ИИ.

С правовой точки зрения, обеспечение возможности поиска материала является устоявшимся добросовестным использованием. Суды признали, что создание поисковых индексов часто требует создания копий исходного материала. Когда Google скопировал целые книги для создания поисковой базы данных, суды признали это добросовестным использованием, поскольку это служило преобразовательной цели — обеспечению обнаружения и исследований. Те же принципы применимы к веб-архивированию.

Практическое влияние на исследования и журналистику

Только Wikipedia ссылается на более чем 2,6 миллиона новостных статей, сохранённых в Internet Archive, охватывающих 249 языков. Бесчисленные блогеры, исследователи и репортёры зависят от Архива как от стабильного, авторитетного свидетельства того, что было опубликовано в сети. Если крупные издатели продолжат блокировать доступ, будущие исследователи могут обнаружить, что значительные части веб-истории исчезли.

📖 Прочитать полный источник: HN AI Agents

Ad

👀 Смотрите также

Глубокое погружение в стоимость DeepSeek V4 Flash: объяснение коэффициента попадания в кэш и ценового соотношения
Новости

Глубокое погружение в стоимость DeepSeek V4 Flash: объяснение коэффициента попадания в кэш и ценового соотношения

DeepSeek V4 Flash стоит 0,0066x за агентное задание по сравнению с Opus 4,7, благодаря 97% попаданий в кэш и соотношению цены чтения/записи кэша 0,02.

OpenClawRadar
Постоянная потеря данных в проектах Claude: исчезновение диалогов без возможности восстановления
Новости

Постоянная потеря данных в проектах Claude: исчезновение диалогов без возможности восстановления

Автор длинных текстов сообщает о потере целых дней работы в Claude Projects из-за исчезновения разговоров из списка чатов проекта; они не находятся поиском и не восстанавливаются, а поддержка Anthropic не отвечает после трех инцидентов.

OpenClawRadar
Разработчик Claude Code признает недостаток адаптивного мышления и предлагает обходное решение.
Новости

Разработчик Claude Code признает недостаток адаптивного мышления и предлагает обходное решение.

Борис Чарный, создатель Claude Code, подтвердил недостаток в функции адаптивного мышления, который вызывает снижение производительности. Пользователи, испытывающие проблемы даже с настройкой effort=high, могут использовать CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 в качестве временного решения.

OpenClawRadar
Agora-1: Многопользовательская модель мира с открытым исходным кодом для симуляции в реальном времени
Новости

Agora-1: Многопользовательская модель мира с открытым исходным кодом для симуляции в реальном времени

Odyssey выпускает Agora-1 — мировую модель, которая позволяет до четырём агентам (человек или ИИ) совместно использовать симуляцию в реальном времени, используя GoldenEye в качестве тестовой среды.

OpenClawRadar