Пещерный человек против подсказки "будь кратким": сравнение эффективности подсказок для сжатия в Клоде

✍️ OpenClawRadar📅 Опубликовано: 29 апреля 2026 г.🔗 Source
Пещерный человек против подсказки "будь кратким": сравнение эффективности подсказок для сжатия в Клоде
Ad

Разработчик сравнил «пещерный» стиль (популярный сокращающий запрос) с простым запросом «будь краток.», чтобы выяснить, оправдывает ли себя дополнительная сложность. Тест включал 24 запроса по 6 категориям, сравнивая 5 вариантов: базовый, «будь краток.», пещерный лайт, пещерный полный и пещерный ультра. Выводы оценивались отдельным экземпляром Claude по рубрикам для каждого запроса.

Ad

Результаты бенчмарка

  • Базовый: средний балл 0.985, среднее количество токенов 636
  • «будь краток.»: средний балл 0.985, среднее количество токенов 419
  • Пещерный лайт: средний балл 0.976, среднее количество токенов 401
  • Пещерный полный: средний балл 0.975, среднее количество токенов 404
  • Пещерный ультра: средний балл 0.970, среднее количество токенов 449

Двухсловная версия сравнялась с пещерным стилем как по сжатию, так и по качеству. Однако ценность пещерного стиля в другом: стабильная структура вывода, переключение режимов и защита от разрушительных операций. Защита, правда, внесла значительную вариативность в качество вывода, что может быть проблемой для некоторых случаев использования.

Полная разбивка с данными по категориям и выводами о вариативности по вопросам безопасности доступна на сайте автора. Инструмент бенчмаркинга с открытым исходным кодом на GitHub.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Anthropic переносит фоновую автоматизацию Claude Code в отдельный кредитный пакет SDK, нарушая работу агентов
Новости

Anthropic переносит фоновую автоматизацию Claude Code в отдельный кредитный пакет SDK, нарушая работу агентов

Начиная с 15 июня, claude -p, использование Agent SDK, Claude Code GitHub Actions и сторонние приложения Agent SDK больше не будут учитываться в интерактивных квотах Pro/Max. Применяется новый отдельный кредитный пул Agent SDK: $100 в месяц для планов Max 5x. Фоновые стеки агентов (например, тикеты → агенты → хуки → исполнитель → claude -p) быстро исчерпают этот лимит.

OpenClawRadar
Федеральным агентствам приказано прекратить использование технологии искусственного интеллекта Anthropic.
Новости

Федеральным агентствам приказано прекратить использование технологии искусственного интеллекта Anthropic.

Президент Дональд Трамп распорядился правительственным агентствам США немедленно прекратить использование технологий компании по искусственному интеллекту Anthropic. Приказ последовал на фоне давления со стороны Министерства обороны в отношении ограничений использования её моделей ИИ.

OpenClawRadar
Частые критические изменения в OpenClaw: Процедуры обновления и текущие проблемы
Новости

Частые критические изменения в OpenClaw: Процедуры обновления и текущие проблемы

OpenClaw выпустил 13 минорных версий только в марте 2026 года, при этом критические изменения происходят каждые 2-3 недели. В источнике приводятся конкретные процедуры обновления и описаны текущие проблемы в версии 3.28, включая изменения в аутентификации localhost и регрессионные ошибки.

OpenClawRadar
YC-Bench тестирует LLM в роли CEO стартапов, GLM-5 демонстрирует высокую рентабельность
Новости

YC-Bench тестирует LLM в роли CEO стартапов, GLM-5 демонстрирует высокую рентабельность

Исследователи создали YC-Bench — бенчмарк, в котором ИИ-модели выступают в роли генеральных директоров симулированных стартапов в течение года, управляя сотрудниками, контрактами и заработной платой. GLM-5 достиг средних финальных средств в размере 1,21 млн долларов при стоимости 7,62 доллара за запуск, показав результат в пределах 5% от Claude Opus 4.6, который стоил 86 долларов за запуск.

OpenClawRadar