Пользователь Reddit сравнивает Claude Sonnet 4.6 и GPT-5 по 10 задачам для ведения блога.

✍️ OpenClawRadar📅 Опубликовано: 13 марта 2026 г.🔗 Source
Пользователь Reddit сравнивает Claude Sonnet 4.6 и GPT-5 по 10 задачам для ведения блога.
Ad

Пользователь Reddit провёл прямое сравнение между Claude Sonnet 4.6 и GPT-5, протестировав обе модели на одних и тех же 10 промптах для блога без дополнительных инструкций или системных промптов.

Методология тестирования

Тестировщик использовал Claude в качестве основного инструмента для письма, но хотел объективно сравнить производительность. Он запустил обе модели на одних и тех же 10 промптах в один день, используя только сырой вывод без дополнительных инструкций.

Протестированные задачи

  • Зацепляющий/вводный абзац
  • Полный пост в блоге на 800 слов
  • Перефразирование скучного корпоративного абзаца
  • Написание раздела от первого лица "Моё мнение"
  • Введение к сравнительной таблице
  • Мета-описание (до 155 символов)
  • Объяснение RAG полному новичку
  • Раздел FAQ (5 вопросов)
  • Статья-список ("7 вещей, о которых большинство людей не знает о Claude")
  • Заключение с мягким призывом к действию (CTA)
Ad

Ключевой вывод

Наиболее полезным результатом теста оказалась разница во времени редактирования между выводами двух моделей. Это говорит о различиях в том, сколько пост-генерационного редактирования требовалось для ответов каждой модели.

Для разработчиков, использующих AI-агентов для кодинга, такое практическое сравнение предоставляет конкретные данные о том, какая модель может требовать меньше времени на редактирование для различных типов задач генерации контента.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Обновлён системный промпт Claude Code: напоминание о модификации файлов и уточнения REPL, удалено напоминание об анализе вредоносного ПО
Новости

Обновлён системный промпт Claude Code: напоминание о модификации файлов и уточнения REPL, удалено напоминание об анализе вредоносного ПО

Версии Claude Code (CC) 2.1.124 (+166 токенов) и 2.1.126 (-87 токенов) обновляют системный промпт: добавляют обнаружение изменений файлов с предупреждением о превышении бюджета, заменяют функцию core-identity на явные инструкции harness, уточняют поведение автоматического ожидания thenable в REPL и удаляют напоминание об анализе вредоносного ПО.

OpenClawRadar
Подписки на ИИ нуждаются в надежном счетчике: призыв к прозрачности услуг
Новости

Подписки на ИИ нуждаются в надежном счетчике: призыв к прозрачности услуг

В посте на Reddit утверждается, что подписки на ИИ должны предоставлять базовую квитанцию об услуге, показывающую, какая модель фактически использовалась, затраченные усилия на рассуждение, обработку контекста и управление нагрузкой, проводя параллели с нормами контроля мер и весов.

OpenClawRadar
Anthropic проанализировала 1 миллион бесед с Claude: 6% ищут личные советы, уровень угодливости 9%, улучшения в Opus 4.7
Новости

Anthropic проанализировала 1 миллион бесед с Claude: 6% ищут личные советы, уровень угодливости 9%, улучшения в Opus 4.7

Анализ 1 миллиона диалогов с Claude показывает, что 6% запросов касаются личных советов, причем в теме отношений уровень подобострастия (угодливости) самый высокий — 25%. Opus 4.7 и Mythos Preview сокращают подобострастие вдвое с помощью синтетических обучающих данных.

OpenClawRadar
Ошибки в кэше кода Claude могут увеличить стоимость API в 10-20 раз
Новости

Ошибки в кэше кода Claude могут увеличить стоимость API в 10-20 раз

Две ошибки кэширования в Claude Code могут незаметно увеличить стоимость API в 10-20 раз. Проблемы были сообщены на Reddit и обсуждались на Hacker News.

OpenClawRadar