Диагностика кэша подсказок Claude: анализ статистики показывает 98,9% коэффициент чтения из кэша

✍️ OpenClawRadar📅 Опубликовано: 20 мая 2026 г.🔗 Source
Диагностика кэша подсказок Claude: анализ статистики показывает 98,9% коэффициент чтения из кэша
Ad

Два дня назад Anthropic выпустила функцию диагностики кэша промптов в Claude Console. Это инструмент для разработчиков, позволяющий понять, почему запрос не попадает в кэш, и снизить затраты. Один разработчик (u/samuelroy_) поделился своей статистикой в ветке сообщества, стремясь найти закономерности и улучшить производительность кэша в целом.

Ключевая статистика из источника

  • Общий коэффициент попаданий в кэш: 98,9%
  • 80% промахов кэша связаны с messages changed.
  • Амортизация записи для Sonnet: 3,69x

Разработчик отметил, что его проект спроектирован так, чтобы только добавлять сообщения в историю, поэтому высокая доля промахов из-за messages changed оказалась неожиданной. Вероятное объяснение — пользователи разветвляют беседы, что изменяет цепочку сообщений.

Ad

Что это значит

Кэширование промптов снижает стоимость и задержку. При коэффициенте попаданий 98,9% разработчик уже эффективен, но диагностические данные показывают четкую область для улучшения: уменьшение ненужных изменений сообщений. Если вы видите похожие паттерны, аудит того, как разветвляются или редактируются беседы, может повысить коэффициент попаданий в кэш.

Для справки: амортизация записи (3,69x для Sonnet) показывает, сколько раз запись кэша выполняется относительно чтений. Меньшее значение — лучше.

Такая аналитика от первого лица — шаг вперед в оптимизации затрат на AI API. Ожидается, что другие провайдеры последуют этому примеру.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Протокол Конвергенции Quumble v5: Результаты эксперимента с кросс-архитектурными LLM
Новости

Протокол Конвергенции Quumble v5: Результаты эксперимента с кросс-архитектурными LLM

Протокол конвергенции Quumble v5 проверяет, сходятся ли независимые экземпляры LLM в описаниях воображаемых существ при получении бессмысленных слов. Результаты показывают, что как Claude (Opus 4.6 и Sonnet 4.6), так и GPT-5.3 независимо друг от друга создали маленькое, круглое, мягкое, лавандового оттенка, биолюминесцентное существо, которое жужжит, исходя из слова 'quumble'.

OpenClawRadar
Кими k2.5: Прокладывая новые пути в автоматизации ИИ
Новости

Кими k2.5: Прокладывая новые пути в автоматизации ИИ

Kimi k2.5 установила новый стандарт в области автоматизации ИИ, обладая передовыми возможностями, которые привлекают внимание в технологическом сообществе. Узнайте, как она перестраивает ландшафт.

OpenClawRadar
开发者从Cursor Composer 2和Kimi 2.6转向Qwen3.6:35b-a3b用于企业工作负载
Новости

开发者从Cursor Composer 2和Kimi 2.6转向Qwen3.6:35b-a3b用于企业工作负载

Разработчик сообщает, что использует Qwen3.6:35b-a3b для повседневной работы над корпоративным приложением объемом 500-700 тыс. строк кода, отмечая лучшую производительность по сравнению с Kimi 2.6 и DeepSeek 4 Pro/Flash, при стоимости ~0,08 $ за 1 млн токенов на OpenRouter.

OpenClawRadar
Проблемы с надежностью шлюза OpenClaw: Тихие сбои после 25 дней интенсивного использования
Новости

Проблемы с надежностью шлюза OpenClaw: Тихие сбои после 25 дней интенсивного использования

Подробный отчет от пользователя OpenClaw, который запускал более 18 cron-задач с интеграцией Telegram в течение 25 дней, выявил критическую проблему: шлюз переходит в «зомбифицированное» состояние — отображается как работающий, но вся функциональность замирает. Пользователь документирует конкретные проблемы, включая бессрочные блокировки записи сессий, cron-задачи, зависшие в фантомном состоянии выполнения, и тихие сбои при неверных конфигурациях.

OpenClawRadar