Реальные почасовые затраты на долгосрочные команды ИИ-агентов

Разработчик на r/ClaudeAI поделился детальными данными о почасовых затратах на запуск команд ИИ-агентов в продакшене на длительные периоды. Их платформа оркестрирует агентов, которые сотрудничают в сессиях по 5+ часов с полным доступом к окружению Linux, браузеру, базам данных, инструментам разработки и другим возможностям.
Разбивка почасовых затрат
- Агенты для программирования ($10-$60/час): Простые скрипты обходятся около $10/час, но сложная разработка приложений с отладкой, обработкой ошибок и чтением документации взлетает до $40-$60/час. Высокое использование токенов происходит из-за циклов рассуждений и постоянного чтения файловой системы.
- Маркетинговые агенты ($10-$30/час): Задачи вроде исследования 50 компаний, поиска потенциальных клиентов и составления персонализированных обращений. Автоматизация браузера требует много ресурсов, а анализ скриншотов сайтов потребляет значительное количество визуальных токенов.
- Агенты для внутренних задач ($5-$15/час): Задачи вроде мониторинга почтовых ящиков, извлечения данных из PDF в Excel и синхронизации с CRM. Дешевле, потому что задачи линейные и требуют меньше "размышлений", чем задачи по программированию.
Технические сложности
Разработчик создал кастомный слой отслеживания для мониторинга использования каждым агентом, что выявило эти затраты, которые не видны в агрегированных дашбордах провайдеров. Они отмечают, что несмотря на затраты до $60/час, агенты всё равно дешевле, чем senior-разработчики ($100+/час), и могут превосходить людей в 5-10 раз по скорости и часто по качеству.
Ключевые технические сложности, которые упоминаются:
- Управление контекстом: Дискуссии между сохранением полной истории (дорого, но умно), суммированием прошлых шагов (дешевле, но агенты иногда теряют нить) или неотправкой исторического контекста для запланированных задач.
- Инфраструктура отслеживания: Построен "брандмауэр" между клиентами и LLM для отслеживания, какой конкретный агент тратит какие деньги, с ограничениями скорости и защитными механизмами на агента.
Разработчик ищет мнения сообщества о том, видят ли другие похожие цифры для долгоработающих агентов и как они справляются с оптимизацией контекста и отслеживанием затрат.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

Антропик блокирует сторонние обёртки от ограничений подписки на Claude, но обходное решение доступно.
Anthropic ограничила доступ сторонних оболочек к лимитам подписки Claude, что может нарушить рабочие процессы, зависящие от этих инструментов. Пользователь Reddit сообщает о разработке обходного решения с открытым исходным кодом после того, как чуть не потерял месяцы тренировочных данных.

1-битное бонсай-изображение 4B: генерация изображений на устройстве с помощью двоичного/троичного FLUX.2
PrismML выпускает Bonsai Image 4B — бинарный (1.125-бит) и тернарный (1.71-бит) вариант FLUX.2 Klein 4B, уменьшающий диффузионный трансформер до 0,93 ГБ / 1,21 ГБ, что позволяет генерировать изображения 512×512 на iPhone 17 Pro Max за 9,4 секунды.

Claude AI тратит 81 минуту на «настоящее мышление» – скачки пользовательских отчетов вокруг крупных обновлений
Пользователь сообщает, что Claude AI потратил 1 час 21 минуту на простую задачу, предполагая, что всплески производительности происходят вскоре после крупных обновлений. Пример: исследовательский запрос просканировал 5 113 источников за один сеанс, но позже — только 100–200 источников для аналогичных запросов.

Anthropic удваивает лимиты использования Claude Code и подписывает сделку на вычисления с SpaceX
Anthropic удвоил пятичасовые окна использования для подписчиков Claude Code Pro и Max, отменил снижение лимитов в часы пик и повысил лимиты API для Opus, ссылаясь на новую сделку со SpaceX на более чем 300 МВт вычислительных мощностей от суперкомпьютера Colossus 1 (более 220 000 GPU NVIDIA).