Нечеткие промпты — настоящая проблема, а не модель: тест из 50 запусков показывает, что качество промпта важнее выбора модели

✍️ OpenClawRadar📅 Опубликовано: 11 мая 2026 г.🔗 Source

Пользователь Reddit провел эксперимент, чтобы проверить распространенное утверждение, что одна ИИ-модель умнее другой. Он взял десять типовых промптов и запустил каждый из них через ChatGPT 4, Claude Sonnet и Gemini 1.5 Pro по пять раз — всего 150 ответов.

Что он выяснил: результаты оказались подозрительно похожи по качеству. Не идентичны, но в одной весовой категории. Все три либо давали что-то пригодное к использованию, либо все три выдавали «шаблонную кашу». Они почти никогда не расходились во мнениях, можно ли ответить на промпт. Переменной была не модель, а промпт.

Два промпта — разные результаты

Один и тот же расплывчатый промпт порождал одинаково безликие ответы во всех моделях. Например:

«Напиши сопроводительное письмо для вакансии в маркетинге»

Все три выдали однотипное шаблонное письмо, подходящее кому угодно. Люди бы назвали его «письмом от ChatGPT», а затем попробовали бы Claude и назвали бы его «письмом от Claude» — то же письмо, другое имя.

Но конкретный промпт всё изменил:

«Напиши сопроводительное письмо для старшей маркетинговой должности в B2B SaaS-компании. У меня 7 лет опыта в росте, в основном в стартапах на стадиях Series A/B. Нанимающий менеджер — технический специалист, бывший инженер. Избегай общих фраз вроде „увлечен“ или „ориентирован на результат“. Используй конкретные цифры из моего опыта, где уместно, придумай правдоподобные. Целевой объем — 280 слов.»

Все три выдали действительно хороший результат. Разный по стилю, но полезный.

Общий паттерн в жалобах

Пользователь просмотрел десятки жалоб «ИИ ужасен» в Twitter и Reddit и заметил тот же паттерн: промпты вроде:

«Помоги с резюме»
«Напиши маркетинговый план»
«Объясни квантовую физику»
«Улучши этот код»

Эти промпты проваливаются, потому что не уточняют кто вы, для кого это, как выглядит успех или чего избегать. Модели приходится угадывать самый распространенный вариант запроса — а это шаблон.

Мысленная модель: промпт как бриф

Ключевое понимание: перестаньте думать об этом как о «задавании вопроса ИИ». Думайте как о «написании брифа для стажера». Хороший бриф говорит стажеру об аудитории, о том, как выглядит успех, чего избегать, о формате, ограничениях и хотя бы одном примере желаемого результата.

Как только пользователь начал писать промпты как брифы, переключение между моделями перестало иметь значение. ChatGPT, Claude и Gemini — все стали заметно лучше, не потому что модели изменились, а потому что изменились промпты.

Если вам хочется сменить модель из-за плохих результатов, попробуйте сначала уточнить промпт. Различия между моделями реальны, но они гораздо меньше, чем различия между промптами.

📖 Читать полный источник: r/ClaudeAI

👀 Смотрите также

Советы

Тихий успех: подход одного разработчика к оповещению о cron-задачах

Разработчик на r/openclaw перестает отправлять уведомления об успешном выполнении здоровых задач cron, оповещая только об ошибках аутентификации, повреждении состояния или повторяющихся сбоях.

3 мая 2026 г., 08:19 UTC

OpenClawRadar

Советы

Снижение галлюцинаций Claude с помощью инъекции промптов перед выводом

Пользователь Reddit поделился методом сокращения галлюцинаций Claude AI примерно вдвое с помощью предварительного промпта, который заставляет модель фиксировать неопределенности и следующие шаги перед ответом. Подход включает добавление специальных инструкций в markdown в системный промпт Claude и создание Python-скрипта.

24 мар. 2026 г., 13:45 UTC

OpenClawRadar

Советы

Построение с Codex, выполнение с OpenClaw: практическое разделение, которое работает

Разработчик рассказывает, как они преодолели разочарование в OpenClaw, разделив задачи: создание логики автоматизации с помощью Codex и использование OpenClaw только как исполнительного слоя — а также как Apple Messages через CarPlay сделало помощника похожим на Джарвиса.

5 июл. 2026 г., 00:19 UTC

OpenClawRadar

Советы

Браузерные агенты съели мой API-бюджет: скрытая стоимость циклов наблюдения

Запускаете ИИ-агентов на реальных веб-задачах? Пользователь Reddit сообщает, что циклы наблюдения браузера — а не модель — являются основным источником затрат. Каждый клик, ожидание и наблюдение вызывают обмен данными, а низкое качество снимков экрана создает порочный круг сбоев, увеличивающий расход токенов. Изолированные среды браузера и более быстрое выполнение агентов — ключевые меры экономии.

21 июн. 2026 г., 12:17 UTC

OpenClawRadar