Затраты на API OpenClaw достигли $275 за 5,5 часов, что в годовом исчислении превышает $200 тыс.

Пользователь Reddit поделился своим опытом эксплуатационных расходов на работу OpenClaw с использованием передовых (SOTA) моделей ИИ через API. В посте подробно описывается конкретный тест затрат, проведённый после перехода с подписки.
Ключевые детали теста
- До этого пользователь несколько месяцев использовал OpenClaw по подписке.
- Он решил протестировать стоимость через API для своего обычного ежедневного использования.
- В качестве модели использовался OpenAI GPT-5.4.
- Тест начался в 11:00.
- К 16:30 (за 5,5 часов) было потрачено $275.
- Экстраполяция этого темпа на год даёт затраты существенно выше $200 000 в год.
- По оценке пользователя, годовая стоимость, вероятно, будет ближе к $300 000.
- Ранее пользователь использовал набор бесплатных кредитов от OpenAI.
Пользователь пришёл к выводу, что необходима значительная оптимизация использования или затрат, и отозвал предыдущие комментарии о прекращении подписок провайдерами (отмечено как шутка). Это служит практическим, реальным примером для разработчиков, рассматривающих инфраструктурные расходы на запуск ИИ-агентов для программирования, таких как OpenClaw, с использованием API моделей высокого класса.
📖 Read the full source: r/openclaw
👀 Смотрите также

Cowork жестко прописывает средние усилия и игнорирует пользовательские настройки для Claude Opus.
Пользователь с планом Max обнаружил, что Cowork передает --effort medium --model claude-opus-4-6 как жестко заданные флаги CLI, игнорируя переменные окружения и переопределения в settings.json. Это означает, что пользователи заперты на среднем уровне усилий и стандартном окне контекста, несмотря на оплату высокого уровня усилий и доступа к 1M контексту.

Внимательное управление: Проблема избирательного забывания в системах памяти искусственного интеллекта
Разработчик, создающий пятиуровневую систему памяти для бота OpenClaw, выявляет ключевое ограничение: современные подходы сосредоточены на воспроизведении информации, но им не хватает механизмов для подавления нерелевантных данных во время сфокусированных задач, что аналогично человеческому механизму внимательного отбора.

Анализ расхода токенов в контекстном окне Claude на 1 млн: данные показывают неограниченный рост и накопление промахов кэша.
Анализ контекстного окна Claude в 1 млн токенов выявил два взаимосвязанных фактора, вызывающих быстрое потребление токенов: неограниченный рост контекста без автоматического уплотнения и дорогостоящие промахи кэша при больших размерах контекста. Автор предоставляет скрипт на Python для анализа личного использования токенов из JSONL-файлов сессий.

Тестирование показывает, что компактная 4B-модель превосходит более крупные языковые модели в приложениях для обмена сообщениями между телефоном и домашними устройствами.
Бенчмарк 8 локальных LLM для приложений чата с телефона на домашний компьютер показал, что Gemma3:4B победила с комплексным показателем пригодности 88.7, несмотря на то что это самая маленькая модель, превзойдя более крупные модели до 24B параметров благодаря более быстрому времени отклика и меньшей тепловой нагрузке.