OpenClaw v2026.3.13 добавляет настройку cacheRetention для каждого агента для экономии затрат на токены OpenAI.

✍️ OpenClawRadar📅 Опубликовано: 14 марта 2026 г.🔗 Source

Что изменилось в v2026.3.13

Версия OpenClaw 2026.3.13 добавила правильную валидацию конфигурации для params.cacheRetention в записях каждого агента. Это позволяет вам устанавливать срок хранения кэша декларативно в вашем файле конфигурации openclaw.json.

Проблема с поведением кэша по умолчанию

OpenAI поддерживает расширенное хранение кэша промптов (24 часа) через параметр prompt_cache_retention: "24h" в их API, что сохраняет префикс вашего промпта в кэше в течение 24 часов вместо стандартных 5-10 минут. Кэшированные входные токены тарифицируются со скидкой 50%.

Если вы запускаете агенты с циклами heartbeat дольше 10 минут (что, как отмечает источник, относится к "практически всем"), ваш кэш полностью остывает между каждым циклом. Это означает, что вы платите полную цену за весь входной контекст при каждом heartbeat.

В источнике описывается настройка с 15 агентами на GPT-5.2 с heartbeat каждые 60-90 минут, где каждый heartbeat гарантированно был холодным стартом. Системный промпт, начальный контекст, HEARTBEAT.md, AGENTS.md, SOUL.md, определения инструментов — всё это пересылалось по полной цене каждый цикл, потому что кэш истекал в промежутке между heartbeat.

Как настроить

Теперь вы можете установить срок хранения кэша в вашем openclaw.json:

{
  "agents": {
    "list": [
      {
        "agentId": "my-agent",
        "params": {
          "cacheRetention": "long"
        }
      }
    ]
  }
}

Значение "long" соответствует параметру OpenAI prompt_cache_retention: "24h" через библиотеку pi-ai.

Важное предостережение: требуется патч времени выполнения

Функция resolveCacheRetention() в OpenClaw имеет защитную оговорку, которая по умолчанию блокирует провайдеров OpenAI. Она пропускает только Anthropic и Bedrock. Поэтому даже с установленной конфигурацией значение фильтруется до того, как достигнет API.

Вам нужен патч времени выполнения из issue #27515, чтобы это заработало. Патч добавляет OpenAI в список разрешённых провайдеров в защитной оговорке. Без конфигурации И патча ничего не произойдёт.

Автор источника отмечает, что у них патч был применён неделями, но значение конфигурации не было установлено — это означает, что патч проверял extraParams?.cacheRetention !== void 0, получал undefined и всё равно блокировал OpenAI. Патч ничего не делал без конфигурации.

Потенциал экономии затрат

При 15 агентах с heartbeat, каждый из которых отправляет ~128K-170K входных токенов за цикл:

Без 24-часового кэша: 100% входных токенов по полной цене, каждый цикл. Кэш умирает в промежутке ~60-90 минут между heartbeat.
С 24-часовым кэшем: Стабильный префикс (системный промпт, конфигурация агента, определения инструментов — обычно 80-90% ввода) остаётся в кэше между heartbeat. Эти токены тарифицируются по половинной цене.

В системе с 15 агентами, работающей полный рабочий день, это сотни циклов heartbeat в день, где основная масса входных токенов переходит с полной цены на половинную. Снижение затрат на ввод быстро накапливается.

📖 Read the full source: r/openclaw

👀 Смотрите также

Советы

8 месяцев ежедневного использования Claude: 9 практических советов (не для программирования)

Пользователь Reddit делится 9 выстраданными уроками за 8 месяцев ежедневного использования Claude для написания текстов и исследований (не кода): редактирование, управление контекстом, настройка стиля и использование Claude в качестве партнёра для размышлений.

20 июн. 2026 г., 00:18 UTC

OpenClawRadar

Советы

Запуск MiniMax M2.7 Q8_0 128K на 2x3090 с разгрузкой CPU – реальные бенчмарки и конфигурация

Пользователь успешно запускает MiniMax M2.7 в квантовании Q8_0 с контекстом 128K на двух RTX 3090 и оперативной памяти DDR4, достигая ~50 токенов/с при обработке промпта и ~10 токенов/с при генерации токенов, а также делится своими флагами llama-server.

17 мая 2026 г., 22:17 UTC

OpenClawRadar

Советы

Запуск полностью локального ИИ-агента на ноутбуке с 6 ГБ видеопамяти: пошаговое руководство для студентов

Изучите, как студенты могут использовать ноутбуки с 6 ГБ видеопамяти для запуска AI-агентов локально, не полагаясь на дорогие API. Наше руководство разбивает важные шаги и инструменты.

8 февр. 2026 г., 21:45 UTC

OpenClawRadar

Советы

Предпочтения пользователей Claude: настройка реддитора для кратких, критических ответов

Редактор Reddit делится своими настройками Claude User Preferences, чтобы получать менее корпоративные и более критические ответы. Советы включают отказ от повторений, начало с выводов и упрощение пунктуации.

8 июл. 2026 г., 00:18 UTC

OpenClawRadar