Anthropic сообщает о промышленном масштабе извлечения данных ИИ Claude китайскими лабораториями.

Anthropic публично раскрыла детали крупномасштабной операции по извлечению данных, нацеленной на ИИ Claude. Согласно анализу ситуации в посте на Reddit, это была не изолированная исследовательская деятельность, а промышленная операция с участием нескольких китайских компаний в области ИИ.
Масштаб утечки
В операции участвовали три конкретных игрока: DeepSeek, Moonshot AI и MiniMax. Эти лаборатории создали более 24 000 поддельных аккаунтов для доступа к API Claude. Через эти аккаунты они собрали более 16 миллионов диалогов из Claude для обучения собственных моделей.
Различие между законным и незаконным дистилляцией
Исходный материал поясняет разницу между стандартными отраслевыми практиками и тем, что произошло здесь:
- Стандартная дистилляция: Использование большой модели для обучения более компактной и эффективной версии для коммерческих клиентов
- Незаконная дистилляция: Описывается как "отмывание возможностей" - перекачка защитных механизмов и логических структур из американских моделей и их прямое внедрение в иностранные военные, разведывательные и системы наблюдения
Более широкие последствия
Anthropic предупреждает, что такие атаки становятся всё более изощрёнными и частыми. "Система чести" использования API оказывается недостаточной для предотвращения подобных операций. Компания призывает к скоординированным защитным мерам между крупными игроками в области ИИ и политиками.
Эта ситуация подчёркивает уязвимость весов моделей после их раскрытия через конечные точки API, даже при наличии существующих защитных мер.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

API AviationWeather.gov содержит попытку внедрения промпта 'Stop Claude' (инъекция промпта).
Пользователь сообщает, что API AviationWeather.gov правительства США возвращает текст 'Stop Claude' в своих ответах при доступе через Claude CoWork, что вызывает уведомление системы безопасности о попытках инъекции промптов.

Данные об угрозах из 91 тыс. взаимодействий с ИИ-агентами: злоупотребление инструментами выросло на 6,4%, появились новые мультимодальные атаки.
Анализ 91 284 взаимодействий ИИ-агентов за февраль 2026 года показывает, что злоупотребление инструментами/командами увеличилось на 6,4% до 14,5%, причём эскалация цепочки инструментов является доминирующим паттерном. Отравление RAG сместилось в сторону атак на метаданные (12,0%), а мультимодальная инъекция через изображения/PDF-файлы появилась на уровне 2,3%.

Критическая уязвимость удаленного выполнения кода (RCE) в библиотеке protobuf.js
Критическая уязвимость удаленного выполнения кода в protobuf.js версий 8.0.0/7.5.4 и ниже позволяет выполнять JavaScript-код через вредоносные схемы. Исправления доступны в версиях 8.0.1 и 7.5.5.

KnightClaw: Локальное расширение безопасности для агентов OpenClaw
KnightClaw — это расширение, которое перехватывает сообщения до их попадания к агентам OpenClaw, предоставляя 8-уровневую гибридную систему обнаружения и редактирование исходящих данных. Оно работает полностью локально, без телеметрии, и имеет лицензию MIT.