OpenClaw v2026.3.13 добавляет настройку cacheRetention для каждого агента для экономии затрат на токены OpenAI.

Что изменилось в v2026.3.13
Версия OpenClaw 2026.3.13 добавила правильную валидацию конфигурации для params.cacheRetention в записях каждого агента. Это позволяет вам устанавливать срок хранения кэша декларативно в вашем файле конфигурации openclaw.json.
Проблема с поведением кэша по умолчанию
OpenAI поддерживает расширенное хранение кэша промптов (24 часа) через параметр prompt_cache_retention: "24h" в их API, что сохраняет префикс вашего промпта в кэше в течение 24 часов вместо стандартных 5-10 минут. Кэшированные входные токены тарифицируются со скидкой 50%.
Если вы запускаете агенты с циклами heartbeat дольше 10 минут (что, как отмечает источник, относится к "практически всем"), ваш кэш полностью остывает между каждым циклом. Это означает, что вы платите полную цену за весь входной контекст при каждом heartbeat.
В источнике описывается настройка с 15 агентами на GPT-5.2 с heartbeat каждые 60-90 минут, где каждый heartbeat гарантированно был холодным стартом. Системный промпт, начальный контекст, HEARTBEAT.md, AGENTS.md, SOUL.md, определения инструментов — всё это пересылалось по полной цене каждый цикл, потому что кэш истекал в промежутке между heartbeat.
Как настроить
Теперь вы можете установить срок хранения кэша в вашем openclaw.json:
{
"agents": {
"list": [
{
"agentId": "my-agent",
"params": {
"cacheRetention": "long"
}
}
]
}
}Значение "long" соответствует параметру OpenAI prompt_cache_retention: "24h" через библиотеку pi-ai.
Важное предостережение: требуется патч времени выполнения
Функция resolveCacheRetention() в OpenClaw имеет защитную оговорку, которая по умолчанию блокирует провайдеров OpenAI. Она пропускает только Anthropic и Bedrock. Поэтому даже с установленной конфигурацией значение фильтруется до того, как достигнет API.
Вам нужен патч времени выполнения из issue #27515, чтобы это заработало. Патч добавляет OpenAI в список разрешённых провайдеров в защитной оговорке. Без конфигурации И патча ничего не произойдёт.
Автор источника отмечает, что у них патч был применён неделями, но значение конфигурации не было установлено — это означает, что патч проверял extraParams?.cacheRetention !== void 0, получал undefined и всё равно блокировал OpenAI. Патч ничего не делал без конфигурации.
Потенциал экономии затрат
При 15 агентах с heartbeat, каждый из которых отправляет ~128K-170K входных токенов за цикл:
- Без 24-часового кэша: 100% входных токенов по полной цене, каждый цикл. Кэш умирает в промежутке ~60-90 минут между heartbeat.
- С 24-часовым кэшем: Стабильный префикс (системный промпт, конфигурация агента, определения инструментов — обычно 80-90% ввода) остаётся в кэше между heartbeat. Эти токены тарифицируются по половинной цене.
В системе с 15 агентами, работающей полный рабочий день, это сотни циклов heartbeat в день, где основная масса входных токенов переходит с полной цены на половинную. Снижение затрат на ввод быстро накапливается.
📖 Read the full source: r/openclaw
👀 Смотрите также

Как настроить утренний брифинг на AI

Использование ntfy для уведомлений агента OpenClaw
Разработчик делится опытом использования самодельной версии ntfy.sh для push-уведомлений от агентов OpenClaw, избегая ботов Discord/Telegram, запуская ntfy serve на том же VPS и используя HTTP POST-запросы.

Сообщество обсуждает решения проблемы потребления токенов в OpenClaw
Пользователи делятся стратегиями управления высоким расходом токенов при работе ИИ-агентов круглосуточно.

Запуск полностью локального ИИ-агента на ноутбуке с 6 ГБ видеопамяти: пошаговое руководство для студентов
Изучите, как студенты могут использовать ноутбуки с 6 ГБ видеопамяти для запуска AI-агентов локально, не полагаясь на дорогие API. Наше руководство разбивает важные шаги и инструменты.