Реальные почасовые затраты на долгосрочные команды ИИ-агентов

✍️ OpenClawRadar📅 Опубликовано: 27 февраля 2026 г.🔗 Source
Реальные почасовые затраты на долгосрочные команды ИИ-агентов
Ad

Разработчик на r/ClaudeAI поделился детальными данными о почасовых затратах на запуск команд ИИ-агентов в продакшене на длительные периоды. Их платформа оркестрирует агентов, которые сотрудничают в сессиях по 5+ часов с полным доступом к окружению Linux, браузеру, базам данных, инструментам разработки и другим возможностям.

Разбивка почасовых затрат

  • Агенты для программирования ($10-$60/час): Простые скрипты обходятся около $10/час, но сложная разработка приложений с отладкой, обработкой ошибок и чтением документации взлетает до $40-$60/час. Высокое использование токенов происходит из-за циклов рассуждений и постоянного чтения файловой системы.
  • Маркетинговые агенты ($10-$30/час): Задачи вроде исследования 50 компаний, поиска потенциальных клиентов и составления персонализированных обращений. Автоматизация браузера требует много ресурсов, а анализ скриншотов сайтов потребляет значительное количество визуальных токенов.
  • Агенты для внутренних задач ($5-$15/час): Задачи вроде мониторинга почтовых ящиков, извлечения данных из PDF в Excel и синхронизации с CRM. Дешевле, потому что задачи линейные и требуют меньше "размышлений", чем задачи по программированию.
Ad

Технические сложности

Разработчик создал кастомный слой отслеживания для мониторинга использования каждым агентом, что выявило эти затраты, которые не видны в агрегированных дашбордах провайдеров. Они отмечают, что несмотря на затраты до $60/час, агенты всё равно дешевле, чем senior-разработчики ($100+/час), и могут превосходить людей в 5-10 раз по скорости и часто по качеству.

Ключевые технические сложности, которые упоминаются:

  • Управление контекстом: Дискуссии между сохранением полной истории (дорого, но умно), суммированием прошлых шагов (дешевле, но агенты иногда теряют нить) или неотправкой исторического контекста для запланированных задач.
  • Инфраструктура отслеживания: Построен "брандмауэр" между клиентами и LLM для отслеживания, какой конкретный агент тратит какие деньги, с ограничениями скорости и защитными механизмами на агента.

Разработчик ищет мнения сообщества о том, видят ли другие похожие цифры для долгоработающих агентов и как они справляются с оптимизацией контекста и отслеживанием затрат.

📖 Прочитать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Антропик блокирует сторонние обёртки от ограничений подписки на Claude, но обходное решение доступно.
Новости

Антропик блокирует сторонние обёртки от ограничений подписки на Claude, но обходное решение доступно.

Anthropic ограничила доступ сторонних оболочек к лимитам подписки Claude, что может нарушить рабочие процессы, зависящие от этих инструментов. Пользователь Reddit сообщает о разработке обходного решения с открытым исходным кодом после того, как чуть не потерял месяцы тренировочных данных.

OpenClawRadar
1-битное бонсай-изображение 4B: генерация изображений на устройстве с помощью двоичного/троичного FLUX.2
Новости

1-битное бонсай-изображение 4B: генерация изображений на устройстве с помощью двоичного/троичного FLUX.2

PrismML выпускает Bonsai Image 4B — бинарный (1.125-бит) и тернарный (1.71-бит) вариант FLUX.2 Klein 4B, уменьшающий диффузионный трансформер до 0,93 ГБ / 1,21 ГБ, что позволяет генерировать изображения 512×512 на iPhone 17 Pro Max за 9,4 секунды.

OpenClawRadar
Claude AI тратит 81 минуту на «настоящее мышление» – скачки пользовательских отчетов вокруг крупных обновлений
Новости

Claude AI тратит 81 минуту на «настоящее мышление» – скачки пользовательских отчетов вокруг крупных обновлений

Пользователь сообщает, что Claude AI потратил 1 час 21 минуту на простую задачу, предполагая, что всплески производительности происходят вскоре после крупных обновлений. Пример: исследовательский запрос просканировал 5 113 источников за один сеанс, но позже — только 100–200 источников для аналогичных запросов.

OpenClawRadar
Anthropic удваивает лимиты использования Claude Code и подписывает сделку на вычисления с SpaceX
Новости

Anthropic удваивает лимиты использования Claude Code и подписывает сделку на вычисления с SpaceX

Anthropic удвоил пятичасовые окна использования для подписчиков Claude Code Pro и Max, отменил снижение лимитов в часы пик и повысил лимиты API для Opus, ссылаясь на новую сделку со SpaceX на более чем 300 МВт вычислительных мощностей от суперкомпьютера Colossus 1 (более 220 000 GPU NVIDIA).

OpenClawRadar