Project Headroom: инструмент инженера Netflix с открытым исходным кодом сокращает затраты на токены ИИ на 90%

✍️ OpenClawRadar📅 Опубликовано: 2 июня 2026 г.🔗 Source

Старший инженер Netflix Теджас Чопра опубликовал в открытом доступе Project Headroom — локальный прокси, который сжимает содержимое окна контекста до того, как оно попадет в LLM. По предварительным оценкам, до 90% токенов избыточны — и с января 2026 года инструмент сэкономил пользователям в сумме $700 000 при обработке 200 миллиардов токенов.

Как это работает

Headroom запускается как прокси на порту 8787 на машине разработчика. Вы оборачиваете свой LLM CLI командой headroom wrap, например:

headroom wrap codex

Он анализирует все входные данные — историю диалогов, логи, выводы инструментов, файлы, фрагменты RAG — и применяет сжатие без потерь, обратимое. Лучше всего он сокращает:

Серверные логи: удаляется 90%
Выводы MCP-инструментов: 70% избыточного JSON
Выводы баз данных: повторяющиеся схемы
Деревья файлов: повторяющиеся метаданные

Созданный на Python и Node, Headroom имеет текущую версию v0.22 с 2000 звездами на GitHub и 120 форками.

Почему это важно

Чопра вдохновился счетом от Claude Sonnet на $287 за рутинную отладку и рефакторинг. Он выяснил, что причина — не его инструкции, а шаблонный код, JSON-схемы и машинные метаданные. «Это не проза. Это не творческое письмо. Это сжимаемые данные, замаскированные под текст», — написал он.

По умолчанию TTL кэша префиксов Claude составляет всего пять минут; после бездействия весь контекст обновляется. Можно установить более длинный TTL, но платить вдвое за запись, чтобы сэкономить 90% на чтении. Headroom обходит эти компромиссы.

Альтернативы

Существуют и другие инструменты: RTK (Rust Token Killer) обрезает многословный вывод команд, а LeanCTX — вариант. Коммерческие варианты, такие как Token Company (финансируется Y Combinator), предлагают сжатие как услугу. Но ключевая особенность Headroom — обратимое сжатие и встраивание в рабочий процесс разработчика.

📖 Читать полный источник: HN AI Agents

👀 Смотрите также

Инструменты

Трепан: Локальный аудитор безопасности VS Code для кода, созданного ИИ

Trepan — это расширение с открытым исходным кодом для VS Code, которое выступает в роли защитника безопасности для предложений кода, сгенерированных ИИ. Оно использует Ollama для проведения локальных проверок безопасности на соответствие правилам конкретного проекта в файле .trepan/system_rules.md.

21 мар. 2026 г., 17:45 UTC

OpenClawRadar

Инструменты

Открытый порт CLI Claude Code на Go выпущен как claw-code-go

Разработчик dolm09 выпустил claw-code-go — полный порт на Go CLI Claude Code с автономным бинарным файлом менее 10 тысяч строк кода. Проект включает TUI с bubbletea, поддержку нескольких провайдеров, клиент MCP и механизм выполнения инструментов.

14 апр. 2026 г., 05:45 UTC

OpenClawRadar

Инструменты

OpenClaw-superpowers добавляет функции надежности для режимов операционных сбоев.

Репозиторий openclaw-superpowers пополнился восемью новыми навыками, ориентированными на надёжность, включая предварительные проверки перед развёртыванием, подтверждение выполнения cron-заданий, восстановление после сброса сессии и управление жизненным циклом аутентификации MCP. Эти дополнения увеличили общее количество навыков до 60, из которых 44 являются нативными для OpenClaw, а 23 предназначены для планирования по расписанию cron.

29 мар. 2026 г., 19:45 UTC

OpenClawRadar

Инструменты

Локальный инструмент для критики изображений с использованием моделей зрения Ollama для обратной связи

Разработчик создал бесплатное настольное приложение, которое анализирует сгенерированные ИИ изображения локально с использованием моделей компьютерного зрения Ollama. Инструмент предоставляет структурированные отчёты с обратной связью, включая предложения по улучшению и рекомендации по апгрейду промптов.

18 апр. 2026 г., 05:45 UTC

OpenClawRadar