Anthropic сообщает о промышленных масштабах атак методом дистилляции на Claude со стороны китайских лабораторий ИИ.

✍️ OpenClawRadar📅 Опубликовано: 24 февраля 2026 г.🔗 Source

Операция по извлечению моделей в промышленных масштабах

Anthropic опубликовала результаты, детализирующие скоординированные атаки дистилляции против Claude, проведённые тремя китайскими лабораториями ИИ. Атаки включали массовое создание поддельных аккаунтов для извлечения способностей Claude к рассуждению через огромное количество взаимодействий с API.

Ключевые детали атаки из отчёта Anthropic

DeepSeek, Moonshot и MiniMax создали более 24 000 поддельных аккаунтов
Общее количество взаимодействий с Claude превысило 16 миллионов
Только MiniMax отправила 13 миллионов запросов
Когда Anthropic выпустила новую модель, MiniMax перенаправила почти половину своего трафика в течение 24 часов
DeepSeek целенаправленно нацеливалась на цепочки рассуждений и цензурно-безопасные ответы
Атаки становились всё более изощрёнными со временем по мере адаптации методов лабораториями

Последствия для безопасности разработчиков ИИ

Этот инцидент подчёркивает уязвимости в безопасности моделей ИИ, когда лаборатории с миллиардными бюджетами систематически пытаются извлечь проприетарные возможности. Масштаб и настойчивость этих атак — охватывающих несколько организаций и адаптирующихся к новым выпускам моделей — указывают на то, что это представляет собой постоянный вектор угрозы, а не изолированные инциденты.

Использованные методы (создание поддельных аккаунтов, целевые запросы на конкретные возможности, быстрая адаптация к новым версиям моделей) потенциально могут быть воспроизведены против других систем ИИ, что поднимает вопросы о безопасности сторонних инструментов ИИ, которые разработчики интегрируют в свои рабочие процессы.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Безопасность

OpenClaw Security: Усиленный базовый уровень, с которого вам следует начать

Самостоятельный хостинг OpenClaw не делает его автоматически безопасным. В посте на Reddit описана усиленная базовая конфигурация: локальный шлюз, изоляция DM на канал, запрет групп runtime/fs/automation, блокировка exec и группы с упоминанием.

27 июн. 2026 г., 12:18 UTC

OpenClawRadar

Безопасность

KnightClaw: Локальное расширение безопасности для агентов OpenClaw

KnightClaw — это расширение, которое перехватывает сообщения до их попадания к агентам OpenClaw, предоставляя 8-уровневую гибридную систему обнаружения и редактирование исходящих данных. Оно работает полностью локально, без телеметрии, и имеет лицензию MIT.

23 февр. 2026 г., 21:45 UTC

OpenClawRadar

Безопасность

Правила Когтя: Набор правил безопасности с открытым исходным кодом для агентов OpenClaw

Открытый набор правил JSON с 139 правилами безопасности, который блокирует деструктивные команды, защищает файлы с учетными данными и оберегает инструкционные файлы от несанкционированных изменений агентами. Работает без зависимости от LLM, используя регулярные выражения на уровне инструментов.

28 мар. 2026 г., 15:45 UTC

OpenClawRadar

Безопасность

llm-hasher: Локальное обнаружение PII и токенизация для гибридных LLM-процессов

llm-hasher — это инструмент, который обнаруживает личную идентифицируемую информацию локально с помощью Ollama до того, как данные попадут к внешним LLM, таким как OpenAI или Claude, токенизирует PII и восстанавливает исходные значения после обработки. Он использует регулярные выражения для структурированных типов данных и локальную LLM для контекстного обнаружения, с зашифрованным хранилищем для сопоставлений.

15 апр. 2026 г., 23:45 UTC

OpenClawRadar