Анализ инструментирования и возможностей телеметрии Claude Code

Недавний анализ исходного кода Claude Code выявил высокоинструментированную систему, которая отслеживает взаимодействия пользователей и детали окружения, выходящие за рамки типичного функционала чат-бота. Система реализует несколько уровней наблюдения и классификации.
Классификация языка и отслеживание настроений
Claude Code использует простое обнаружение ключевых слов, а не глубокое понимание ИИ, для классификации языка. Он поддерживает буквальные списки ключевых слов, включая такие слова, как "wtf", "this sucks", "frustrating", "shit", "fuck" и "pissed off", которые активируют флаги негативного настроения. Даже фразы вроде "continue", "go on" и "keep going" отслеживаются. Эта классификация происходит на уровне регулярных выражений до того, как модель ответит.
Отслеживание поведения при запросах разрешений
Система отслеживает детальное поведение пользователей во время запросов разрешений, а не только окончательные решения. Она отслеживает, открывают ли пользователи окно обратной связи, закрывают его, нажимают Escape без ввода или что-то вводят, а затем отменяют. Внутренние события имеют такие названия, как tengu_accept_feedback_mode_entered, tengu_reject_feedback_mode_entered и tengu_permission_request_escape. Она даже подсчитывает попытки нажатия Escape, различая быстрые отказы и нерешительное поведение, когда пользователи что-то вводят перед отказом.
Дизайн системы обратной связи
Система обратной связи срабатывает на основе правил темпа, времени восстановления и вероятности, а не случайным образом. Когда пользователи отмечают что-то как плохое, она может предложить им запустить /issue и подтолкнуть их к обмену расшифровками сеансов. Если согласие получено, она может включить основные расшифровки, расшифровки под-агентов, а иногда и необработанные журналы JSONL с редактированием.
Скрытые команды и изменения поведения
Некоторые команды не очевидны без чтения кода. Примеры включают:
ultrathink→ повышает уровень усилий и меняет стиль интерфейсаultraplan→ запускает удаленный режим планированияultrareview→ аналогичная идея для рабочих процессов проверки/btw→ запускает побочного агента, чтобы основной поток продолжался
Поле ввода анализирует их в реальном времени во время набора.
Телеметрия и снятие отпечатков окружения
Каждый сеанс регистрирует обширные данные, включая идентификаторы сеансов, идентификаторы контейнеров, пути к рабочему пространству, хэши репозиториев, детали среды выполнения/платформы, контекст GitHub Actions и идентификаторы удаленных сеансов. При включении определенных флагов она также может регистрировать запросы пользователей и результаты работы инструментов. Это создает детальный отпечаток окружения, выходящий за рамки базовой аналитики использования.
Раскрытие данных команд MCP
Запуск claude mcp get <name> может возвращать URL-адреса серверов, заголовки, подсказки OAuth и полные блоки окружения для stdio-серверов. Если переменные окружения содержат секреты, они могут появиться в выводе терминала.
Внутренняя инструментация сборки
Существует режим (USER_TYPE=ant), в котором он собирает дополнительные данные, включая пространство имен Kubernetes, точный идентификатор контейнера и полный контекст разрешений с путями, правилами песочницы и обходами. Все это регистрируется под внутренними событиями телеметрии, позволяя привязать поведение к конкретным средам развертывания.
Анализ приходит к выводу, что Claude Code — это не просто чат-бот, а высокоинструментированная система, наблюдающая за тем, как пользователи взаимодействуют с ней. Уровень отслеживания и классификации глубже, чем ожидало бы большинство пользователей, хотя анализ не утверждает о злонамеренных намерениях.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Открытые инструменты искусственного интеллекта создают угрозы безопасности из-за «иллюзии безопасности через прозрачность».
В посте на Reddit предупреждают о вредоносном ПО, замаскированном под открытые ИИ-агенты и инструменты, где зловредный код может быть скрыт в больших кодовых базах, которые пользователи считают безопасными, потому что они на GitHub. В посте описывается, как «вайб-кодинг» и автономные ИИ-агенты приучают пользователей запускать неизвестные программы без проверки.

Три вектора атаки через электронную почту против ИИ-агентов, читающих письма
В посте на Reddit описаны три конкретных метода, которые злоумышленники могут использовать для захвата ИИ-агентов, обрабатывающих электронную почту: Подмена инструкций, Экфильтрация данных и Скрытая передача токенов. Эти методы используют неспособность агента отличить законные инструкции от вредоносных, встроенных в текст письма.

Agent-Drift: инструмент мониторинга безопасности для AI-агентов

Разработчик создает песочницу Firecracker MicroVM для безопасности OpenClaw.
Разработчик, обеспокоенный безопасностью LLM, создал минималистичную песочницу с использованием микровиртуальных машин Firecracker для изоляции скриптов OpenClaw, где каждый скрипт выполняется в собственном ядре Linux с ограничением оперативной памяти в 128 МБ и без доступа к сети по умолчанию.