Реальные почасовые затраты на долгосрочные команды ИИ-агентов

Разработчик на r/ClaudeAI поделился детальными данными о почасовых затратах на запуск команд ИИ-агентов в продакшене на длительные периоды. Их платформа оркестрирует агентов, которые сотрудничают в сессиях по 5+ часов с полным доступом к окружению Linux, браузеру, базам данных, инструментам разработки и другим возможностям.
Разбивка почасовых затрат
- Агенты для программирования ($10-$60/час): Простые скрипты обходятся около $10/час, но сложная разработка приложений с отладкой, обработкой ошибок и чтением документации взлетает до $40-$60/час. Высокое использование токенов происходит из-за циклов рассуждений и постоянного чтения файловой системы.
- Маркетинговые агенты ($10-$30/час): Задачи вроде исследования 50 компаний, поиска потенциальных клиентов и составления персонализированных обращений. Автоматизация браузера требует много ресурсов, а анализ скриншотов сайтов потребляет значительное количество визуальных токенов.
- Агенты для внутренних задач ($5-$15/час): Задачи вроде мониторинга почтовых ящиков, извлечения данных из PDF в Excel и синхронизации с CRM. Дешевле, потому что задачи линейные и требуют меньше "размышлений", чем задачи по программированию.
Технические сложности
Разработчик создал кастомный слой отслеживания для мониторинга использования каждым агентом, что выявило эти затраты, которые не видны в агрегированных дашбордах провайдеров. Они отмечают, что несмотря на затраты до $60/час, агенты всё равно дешевле, чем senior-разработчики ($100+/час), и могут превосходить людей в 5-10 раз по скорости и часто по качеству.
Ключевые технические сложности, которые упоминаются:
- Управление контекстом: Дискуссии между сохранением полной истории (дорого, но умно), суммированием прошлых шагов (дешевле, но агенты иногда теряют нить) или неотправкой исторического контекста для запланированных задач.
- Инфраструктура отслеживания: Построен "брандмауэр" между клиентами и LLM для отслеживания, какой конкретный агент тратит какие деньги, с ограничениями скорости и защитными механизмами на агента.
Разработчик ищет мнения сообщества о том, видят ли другие похожие цифры для долгоработающих агентов и как они справляются с оптимизацией контекста и отслеживанием затрат.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

NVIDIA анонсирует NemoClaw с функциями безопасности OpenShell.
NVIDIA анонсировала NemoClaw на GTC, развивая OpenClaw для добавления корпоративной безопасности через OpenShell, который обеспечивает политики конфиденциальности и защитные механизмы для ИИ-агентов.

Оркестратор: Почему намерение должно пережить процесс
Современные стековые решения для агентов переворачивают идентичность и поверхность — оркестрационный слой должен находиться между агентами и средами выполнения, предоставляя примитивы идентичности, маршрутизации, передачи управления и междрайверные вызовы. Практический пример: триаж нестабильного теста через Ollama, Gemini CLI и Grok Build под одной целью.

Первый в мире эксклюзив GitHub для ИИ-агентов запущен: Ограниченный бета-тест для 100 пользователей.
Разработан инновационный эксклюзив GitHub для AI-кодеров, с ограниченным бета-тестированием на 100 пользователей. Узнайте, как этот инструмент готов революционизировать сотрудничество в области ИИ.

Эффективность токенов Opus 4.7: немецкие промпты расходуют до 2 раз больше токенов по сравнению с английскими
Подписчик Claude Pro сообщает, что использование немецкого языка с Opus 4.7 израсходовало 100% токенов сессии за секунды, в то время как английский использовал 37%. Неэффективность токенизатора обусловлена сложными существительными и умлаутами, что приводит к 1,5–2-кратному расходу токенов.