Бенчмарк торговых стратегий: Более дешёвые модели ИИ превосходят Claude Opus 4.6

✍️ OpenClawRadar📅 Опубликовано: 25 февраля 2026 г.🔗 Source
Бенчмарк торговых стратегий: Более дешёвые модели ИИ превосходят Claude Opus 4.6
Ad

Пользователь Reddit провёл сравнительный анализ 10 различных крупных языковых моделей на их способность разрабатывать торговые стратегии. Результаты показали, что более дешёвые модели стабильно превосходили более дорогие варианты, причём Claude Opus 4.6 не смог войти в первую четвёрку, несмотря на стоимость в 10 раз выше, чем у некоторых конкурентов.

Протестированные модели

  • Claude Opus 4.6
  • Gemini 3
  • Gemini 3.1 Pro
  • GPT-5.2
  • Gemini Flash 3
  • GPT-5-mini
  • Kimi K2.5
  • Minimax 2.5
Ad

Ключевые выводы

В ходе тестирования всем моделям был задан одинаковый запрос: «создать лучшую торговую стратегию». Модели вроде Minimax 2.5 и Gemini 3.1 возглавили рейтинг, в то время как модели Anthropic показали слабые результаты в сравнении. Kimi K2.5 превзошёл Claude в этом соревновании, будучи в 10 раз дешевле.

Эксперимент проводился трижды для обеспечения стабильности результатов. Автор отметил, что умение хорошо программировать не обязательно означает хорошие результаты в других задачах, таких как разработка стратегий.

Подобные специализированные тесты полезны для разработчиков, которым нужно выбирать модели ИИ для конкретных задач, выходящих за рамки общей помощи в программировании. Результаты показывают, что выбор модели должен быть ориентирован на конкретную задачу, а не основываться только на общей репутации или цене.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Обновление PostmarketOS за февраль 2026 года: Универсальные ядра и политика в области ИИ
Новости

Обновление PostmarketOS за февраль 2026 года: Универсальные ядра и политика в области ИИ

PostmarketOS теперь предлагает универсальные пакеты ядра (linux-postmarketos-mainline, -stable, -lts) и обновила свою политику в отношении ИИ, явно запретив генеративный ИИ. В проекте также произошли изменения среди участников и улучшения аппаратного CI.

OpenClawRadar
Инструменты искусственного интеллекта требуют практической интеграции для малого бизнеса, а не просто шумихи.
Новости

Инструменты искусственного интеллекта требуют практической интеграции для малого бизнеса, а не просто шумихи.

Сообщество ИИ сосредоточено на технических дебатах, в то время как владельцам малого бизнеса нужны существующие инструменты, интегрированные в их рабочие процессы, для решения повторяющихся задач, таких как планирование, последующие действия и ведение бухгалтерии.

OpenClawRadar
Клауд-Код v2.1.30 выпущен с улучшениями для PDF и OAuth
Новости

Клауд-Код v2.1.30 выпущен с улучшениями для PDF и OAuth

Claude-Code v2.1.30 представляет улучшения в чтении PDF, предварительно настроенный OAuth для серверов MCP, а также несколько исправлений и улучшений.

OpenClawRadar
Gemma 4: Ранние признаки. Упор на практическое внедрение, а не на хайп, для локальных рабочих процессов с агентами.
Новости

Gemma 4: Ранние признаки. Упор на практическое внедрение, а не на хайп, для локальных рабочих процессов с агентами.

Запуск Gemma 4 подчеркивает развертывание на различных уровнях аппаратного обеспечения с официальной позицией для персонального оборудования и периферийных/мобильных устройств, квантование NVIDIA NVFP4 демонстрирует 4-кратное сжатие с сохранением 99,7% базовых показателей на GPQA, а рейтинги Arena помещают плотную модель 31B примерно на 27-е место.

OpenClawRadar