ИИ-агенты, не сокращающие расходы на обслуживание, потянут вашу команду на дно

Джеймс Шор высказывает критическое замечание для команд, использующих агентов ИИ для написания кода: если ваш агент не снижает затраты на обслуживание пропорционально увеличению скорости, вы копаете себе яму. Он моделирует математику прямо — и результат неутешителен.
Затраты на обслуживание доминируют в долгосрочной производительности
Шор использует краудсорсинговую модель: на каждый месяц написания кода ожидайте 10 дней обслуживания в первый год, затем 5 дней в год навсегда. При моделировании на 10 лет команды тратят >50% времени на обслуживание после 2,5 лет. Снижение оценки затрат на обслуживание вдвое дает еще 3 года до достижения 50%. Удвоение их приводит к тому, что команда падает ниже 50% менее чем за год.
Ловушка ИИ: скорость сейчас, боль навсегда
Экстремальный пример Шора: ваш ИИ удваивает вывод, но также удваивает стоимость обслуживания на строку. Результат — через ~5 месяцев производительность возвращается к базовому уровню. Еще через несколько месяцев вы оказываетесь в худшем положении, чем если бы никогда не использовали агента. Даже если код ИИ соответствует удобству сопровождения человеческого кода, выигрыш в производительности со временем исчезает по мере накопления бремени обслуживания.
«Вы производите два месяца работы за месяц, и каждый «месяц» вывода стоит вдвое дороже в обслуживании. Затраты на обслуживание следующего месяца утраиваются.»
Назад дороги нет
Если вы откажетесь от агента, преимущество в скорости исчезнет — но накопленные более высокие затраты на обслуживание останутся. Вы навсегда обрекли свою будущую производительность на временный прирост.
Вывод для команд
Основной посыл Шора: требуйте инструменты ИИ, которые снижают затраты на обслуживание, а не просто пишут код быстрее. Измеряйте бремя обслуживания на фичу. Если вывод вашего агента не значительно дешевле в обслуживании на единицу функциональности, вы обмениваете краткосрочную скорость на долгосрочную боль.
Полный пост (ссылка ниже) содержит модель электронной таблицы для самостоятельных расчетов.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Claude Code якобы отклоняет запросы или взимает дополнительную плату, когда в коммитах упоминается 'OpenClaw'
Твит от Theo утверждает, что Claude Code либо отказывает в запросах, либо взимает дополнительную плату, если ваши git-коммиты упоминают 'OpenClaw', что вызвало обсуждение на HN.

Ведущие модели искусственного интеллекта демонстрируют разрыв в производительности при работе с неанглийскими языками.
Недавний анализ показывает, что ведущие модели ИИ работают хуже на языках, отличных от английского. Статья набрала 16 баллов и 3 комментария на Hacker News.

Пользователь Reddit сообщает о 18,8 ток/с при CPU-инференсе модели Qwen 3 30B Q4 на архитектуре Zen 4.
Пользователь на r/LocalLLaMA протестировал Qwen 3 30B Q4 на процессоре и достиг 18,8 токенов в секунду с процессором Zen 4 и памятью DDR5, что значительно превысило ожидания в 3-5 ток/с.

调查:Claude Code代理因压缩更改展示未经验证的MEMORY.md内容
Пользователь сообщает, что агенты Claude Code извлекают содержимое из MEMORY.md без повторной проверки в середине задачи, что связано с изменениями в уплотнении в версиях 2.1.139 и 2.1.141. Два усугубляющих фактора: агрессивное сохранение «инструкций пользователя» и ошибка в порогах автокомпактизации.