Project Headroom: инструмент инженера Netflix с открытым исходным кодом сокращает затраты на токены ИИ на 90%

✍️ OpenClawRadar📅 Опубликовано: 2 июня 2026 г.🔗 Source
Project Headroom: инструмент инженера Netflix с открытым исходным кодом сокращает затраты на токены ИИ на 90%
Ad

Старший инженер Netflix Теджас Чопра опубликовал в открытом доступе Project Headroom — локальный прокси, который сжимает содержимое окна контекста до того, как оно попадет в LLM. По предварительным оценкам, до 90% токенов избыточны — и с января 2026 года инструмент сэкономил пользователям в сумме $700 000 при обработке 200 миллиардов токенов.

Как это работает

Headroom запускается как прокси на порту 8787 на машине разработчика. Вы оборачиваете свой LLM CLI командой headroom wrap, например:

headroom wrap codex

Он анализирует все входные данные — историю диалогов, логи, выводы инструментов, файлы, фрагменты RAG — и применяет сжатие без потерь, обратимое. Лучше всего он сокращает:

  • Серверные логи: удаляется 90%
  • Выводы MCP-инструментов: 70% избыточного JSON
  • Выводы баз данных: повторяющиеся схемы
  • Деревья файлов: повторяющиеся метаданные

Созданный на Python и Node, Headroom имеет текущую версию v0.22 с 2000 звездами на GitHub и 120 форками.

Ad

Почему это важно

Чопра вдохновился счетом от Claude Sonnet на $287 за рутинную отладку и рефакторинг. Он выяснил, что причина — не его инструкции, а шаблонный код, JSON-схемы и машинные метаданные. «Это не проза. Это не творческое письмо. Это сжимаемые данные, замаскированные под текст», — написал он.

По умолчанию TTL кэша префиксов Claude составляет всего пять минут; после бездействия весь контекст обновляется. Можно установить более длинный TTL, но платить вдвое за запись, чтобы сэкономить 90% на чтении. Headroom обходит эти компромиссы.

Альтернативы

Существуют и другие инструменты: RTK (Rust Token Killer) обрезает многословный вывод команд, а LeanCTX — вариант. Коммерческие варианты, такие как Token Company (финансируется Y Combinator), предлагают сжатие как услугу. Но ключевая особенность Headroom — обратимое сжатие и встраивание в рабочий процесс разработчика.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

TeamHero v2.6.1: Открытая Платформа для Управления ИИ-Агентами Claude
Инструменты

TeamHero v2.6.1: Открытая Платформа для Управления ИИ-Агентами Claude

TeamHero v2.6.1 — это локально-ориентированная платформа с открытым исходным кодом, которая создаёт управляемую команду агентов Claude с такими функциями, как режим автопилота, вложенность подзадач, представления потоков и постоянная память. Инструмент работает на Node.js с простой панелью управления на HTML/CSS/JS и не требует базы данных.

OpenClawRadar
Калибр: Локальный CLI инструмент создает конфигурации AI-ассистента для программирования из вашего репозитория
Инструменты

Калибр: Локальный CLI инструмент создает конфигурации AI-ассистента для программирования из вашего репозитория

Caliber — это локальный CLI-инструмент, который сканирует репозитории на языках TypeScript, Python, Go и Rust, а затем генерирует промпты и конфигурационные файлы для AI-ассистентов программирования, включая Claude Code, Cursor и Codex. Он полностью работает на вашем компьютере с вашими ключами, имеет 13 тысяч установок через npm и распространяется под лицензией MIT с открытым исходным кодом.

OpenClawRadar
Сравнение RunLobster и размещенных решений OpenClaw
Инструменты

Сравнение RunLobster и размещенных решений OpenClaw

Разработчик тестировал RunLobster против KiwiClaw, xCloud и самостоятельно размещённого OpenClaw по 2 недели каждый. RunLobster принципиально отличается как продукт, а не просто хостинг, с 3000 интеграций в один клик и памятью, которая накапливается со временем.

OpenClawRadar
Шесть инструментов с открытым исходным кодом, решающих проблемы безопасности, стоимости и сложности OpenClaw
Инструменты

Шесть инструментов с открытым исходным кодом, решающих проблемы безопасности, стоимости и сложности OpenClaw

Разработчик протестировал шесть инструментов сообщества для устранения уязвимостей безопасности OpenClaw, отмеченных Cisco, растущих затрат и сложной настройки. ClawSec обеспечивает сканирование безопасности и проверку целостности, Antfarm позволяет создавать детерминированные рабочие процессы с несколькими агентами, а LanceDB Pro улучшает поиск в памяти с помощью гибридного векторного поиска.

OpenClawRadar