Утечка исходного кода Claude раскрывает защиту от дистилляции, режим под прикрытием и обнаружение фрустрации

✍️ OpenClawRadar📅 Опубликовано: 1 апреля 2026 г.🔗 Source

Anthropic случайно включила файл .map в свой npm-пакет Claude Code, содержащий полный читаемый исходный код CLI-инструмента. Пакет с тех пор был удалён, но код широко разошёлся и анализировался на Hacker News. Это следует за другой недавней утечкой спецификации модели Anthropic.

Противодистилляция: внедрение фейковых инструментов для отравления подражателей

В файле claude.ts (строки 301-313) есть флаг под названием ANTI_DISTILLATION_CC. При включении Claude Code отправляет anti_distillation: ['fake_tools'] в своих API-запросах, указывая серверу тихо внедрять ложные определения инструментов в системный промпт. Это предназначено для загрязнения обучающих данных, если кто-то записывает трафик API для обучения конкурирующих моделей.

Для активации требуется выполнение четырёх условий: флаг времени компиляции ANTI_DISTILLATION_CC, точка входа CLI, API-провайдер от первого лица и флаг GrowthBook tengu_anti_distill_fake_tool_injection, возвращающий true. Прокси-сервер MITM, удаляющий поле anti_distillation из тел запросов, полностью обойдёт эту защиту. Установка переменной окружения CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS в истинное значение отключает весь механизм.

Второй механизм противодистилляции в файле betas.ts (строки 279-298) реализует серверное суммаризацию текста коннектора. При включении API буферизует текст ассистента между вызовами инструментов, суммирует его и возвращает сводку с криптографической подписью. Это означает, что записи трафика API будут захватывать только сводки, а не полные цепочки рассуждений.

Режим «под прикрытием»: ИИ, который скрывает, что он ИИ

Файл undercover.ts реализует режим, который удаляет все следы внутренних компонентов Anthropic, когда Claude Code используется в невнутренних репозиториях. Он инструктирует модель никогда не упоминать внутренние кодовые имена, такие как «Capybara» или «Tengu», внутренние Slack-каналы, имена репозиториев или саму фразу «Claude Code». В строке 15 указано: «НЕТ принудительного ВЫКЛЮЧЕНИЯ. Это защищает от утечек кодовых имён модели».

Вы можете принудительно включить его с помощью CLAUDE_CODE_UNDERCOVER=1, но нет способа принудительно отключить. Во внешних сборках вся функция устраняется как мёртвый код, сводясь к тривиальным возвратам. Это означает, что коммиты и PR, созданные ИИ от сотрудников Anthropic в проектах с открытым исходным кодом, не будут иметь никаких указаний на то, что их написал ИИ.

Обнаружение фрустрации через регулярные выражения

Другие находки

Аттестация нативного клиента ниже среды выполнения JS
250 000 потраченных впустую API-вызовов в день
KAIROS: невыпущенный режим автономного агента

Утечка произошла всего через десять дней после того, как Anthropic направила юридические угрозы OpenCode, вынудив их удалить встроенную аутентификацию Claude, потому что сторонние инструменты использовали внутренние API Claude Code для доступа к Opus по подписным тарифам вместо пословной оплаты.

📖 Прочитать полный источник: HN AI Agents

👀 Смотрите также

Новости

Сертифицированный архитектор Claude Foundations (CCA-F) Экзамен: Результат 985/1000 — Руководство по подготовке и тренировочный тест

Пользователь Reddit делится опытом сдачи экзамена Claude Certified Architect Foundations (CCA-F) на 985/1000 баллов. Включает практические советы по инжинирингу промптов, управлению контекстными окнами и рабочим процессам с участием человека, а также ссылки на учебные курсы, кулинарную книгу и бесплатный пробный экзамен.

7 июл. 2026 г., 12:20 UTC

OpenClawRadar

Новости

Исследование ETH Zurich ставит под сомнение ценность файлов AGENTS.md для ИИ-агентов в программировании

Новое исследование ETH Zurich показывает, что файлы AGENTS.md, сгенерированные LLM, снижают успешность выполнения задач ИИ-агентами на 3% и увеличивают затраты на вывод более чем на 20%, в то время как файлы, написанные человеком, дают лишь незначительный прирост в 4% при аналогичном увеличении затрат.

8 мар. 2026 г., 15:45 UTC

OpenClawRadar

Новости

Claude Code v2.1.183: Безопасный авторежим, исправления TUI и блокировка деструктивных команд Git

Claude Code v2.1.183 блокирует опасные команды git в автоматическом режиме, если вы явно не попросите, добавляет предупреждения об устаревании моделей, исправляет повреждение TUI в Windows Terminal и многое другое.

19 июн. 2026 г., 12:17 UTC

OpenClawRadar

Новости

Подписчики ЕС сообщают о нераскрытых ограничениях использования Claude Pro – возможное нарушение законодательства о защите прав потребителей

В одном из постов на Reddit описывается, как маркетинговые обещания Claude Pro «без ограничений» приводят к дополнительным расходам для пользователей из ЕС и скрытым лимитам сессий, что может нарушать директивы ЕС о защите прав потребителей.

7 мая 2026 г., 22:18 UTC

OpenClawRadar