Нечеткие промпты — настоящая проблема, а не модель: тест из 50 запусков показывает, что качество промпта важнее выбора модели

Пользователь Reddit провел эксперимент, чтобы проверить распространенное утверждение, что одна ИИ-модель умнее другой. Он взял десять типовых промптов и запустил каждый из них через ChatGPT 4, Claude Sonnet и Gemini 1.5 Pro по пять раз — всего 150 ответов.
Что он выяснил: результаты оказались подозрительно похожи по качеству. Не идентичны, но в одной весовой категории. Все три либо давали что-то пригодное к использованию, либо все три выдавали «шаблонную кашу». Они почти никогда не расходились во мнениях, можно ли ответить на промпт. Переменной была не модель, а промпт.
Два промпта — разные результаты
Один и тот же расплывчатый промпт порождал одинаково безликие ответы во всех моделях. Например:
«Напиши сопроводительное письмо для вакансии в маркетинге»
Все три выдали однотипное шаблонное письмо, подходящее кому угодно. Люди бы назвали его «письмом от ChatGPT», а затем попробовали бы Claude и назвали бы его «письмом от Claude» — то же письмо, другое имя.
Но конкретный промпт всё изменил:
«Напиши сопроводительное письмо для старшей маркетинговой должности в B2B SaaS-компании. У меня 7 лет опыта в росте, в основном в стартапах на стадиях Series A/B. Нанимающий менеджер — технический специалист, бывший инженер. Избегай общих фраз вроде „увлечен“ или „ориентирован на результат“. Используй конкретные цифры из моего опыта, где уместно, придумай правдоподобные. Целевой объем — 280 слов.»
Все три выдали действительно хороший результат. Разный по стилю, но полезный.
Общий паттерн в жалобах
Пользователь просмотрел десятки жалоб «ИИ ужасен» в Twitter и Reddit и заметил тот же паттерн: промпты вроде:
«Помоги с резюме»«Напиши маркетинговый план»«Объясни квантовую физику»«Улучши этот код»
Эти промпты проваливаются, потому что не уточняют кто вы, для кого это, как выглядит успех или чего избегать. Модели приходится угадывать самый распространенный вариант запроса — а это шаблон.
Мысленная модель: промпт как бриф
Ключевое понимание: перестаньте думать об этом как о «задавании вопроса ИИ». Думайте как о «написании брифа для стажера». Хороший бриф говорит стажеру об аудитории, о том, как выглядит успех, чего избегать, о формате, ограничениях и хотя бы одном примере желаемого результата.
Как только пользователь начал писать промпты как брифы, переключение между моделями перестало иметь значение. ChatGPT, Claude и Gemini — все стали заметно лучше, не потому что модели изменились, а потому что изменились промпты.
Если вам хочется сменить модель из-за плохих результатов, попробуйте сначала уточнить промпт. Различия между моделями реальны, но они гораздо меньше, чем различия между промптами.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Основные пользовательские инструкции для Claude, чтобы предотвратить типичные раздражающие моменты
Пользователь Reddit делится тремя конкретными пользовательскими инструкциями для решения распространённых проблем в работе с Claude: требование предупреждений перед деструктивными командами, предотвращение изменения плана в середине ответа и использование блоков кода исключительно для функционального кода.

Высокая загрузка ЦП/ОЗУ и перезагрузки шлюза в OpenClaw? Отключите IPv6 для Telegram
Установка autoSelectFamily: false и dnsResultOrder: 'ipv4first' в конфиге бота Telegram предотвращает ошибки ENETUNREACH, устраняя высокую загрузку ЦП, заморозки цикла событий и перезапуски шлюза.

在Claude Code之上构建处理上下文与协调的流程层
Команда рассказывает, как они построили процессный слой поверх Claude Code, который объявляет входы/выходы для каждого этапа разработки, уменьшая потерю контекста при передаче задач и обеспечивая совокупный рост продуктивности без опоры на индивидуальную дисциплину.

Пять распространенных ошибок при настройке OpenClaw, которые приводят к потере денег и создают угрозы безопасности
На основе анализа более 50 конфигураций OpenClaw, одни и те же пять проблем возникают снова и снова: использование Opus в качестве модели по умолчанию вместо Sonnet для большинства задач, отсутствие запуска новых сессий, установка навыков без чтения исходного кода, открытие шлюза для сети и добавление второго агента до исправления первого.