MiniMax M2.7 vs Claude Opus 4.7: 3 результата рабочих процессов

Андрей Лукьяненко протестировал MiniMax M2.7 на трех реалистичных ML- и кодинг-процессах через API, используя Claude Code в качестве оболочки. Цель: увидеть, как M2.7 работает в агентных циклах по сравнению с Claude Opus 4.7.

Настройка

Тестовая среда обернула API MiniMax в команду claude-mm, которая направляет Claude Code на M2.7:

claude-mm () {
  ANTHROPIC_BASE_URL = "https://api.minimax.io/anthropic" \
  ANTHROPIC_AUTH_TOKEN = "$MINIMAX_API_KEY" \
  ANTHROPIC_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_DEFAULT_SONNET_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_DEFAULT_OPUS_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_DEFAULT_HAIKU_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_SMALL_FAST_MODEL = "MiniMax-M2.7" \
  API_TIMEOUT_MS = "3000000" \
  CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC = "1" \
  claude "$@"
}

Он работал на тарифе Plus от MiniMax ($40/месяц), где контекстного окна и дневной пропускной способности было достаточно для многошаговой агентной работы.

Рабочий процесс 1: Рефакторинг проекта PyTorch

Задача заключалась в обновлении зависимостей и качества кода в репозитории pytorch_tempest (Hydra + PyTorch Lightning). Изменения включали:

Обновление версий CI и pre-commit хуков.
Замена black + flake8 на ruff для линтинга и форматирования.
Включение fsdp_sharding_strategy в конфигурации тренера Lightning.
Обновление документации.
Добавление uv для управления окружением.
Переход на современную типизацию Python (list[X] вместо List[X], X | None вместо Optional[X]).
Удаление дублирующихся путей кода.

Подход был пошаговым: Лукьяненко давал явные требования, проверял каждое изменение и давал обратную связь, когда diff выходил за рамки. M2.7 хорошо подходил для этого, так как оставался в узких рамках промптов и позволял построчный просмотр. Ошибки CI исправлялись итеративно с помощью агента.

Рабочий процесс 2: Заметки Obsidian Vault

Для написания и проверки ML-заметок в Obsidian Лукьяненко настраивал промпты специально под M2.7. Он начал с того, что попросил и M2.7, и Opus 4.7 сгенерировать заметки по одному и тому же промпту, затем попросил M2.7 прочитать оба вывода и предложить улучшенный промпт для себя. Получившийся промпт (сокращённый) был:

Заполни одну битую ссылку-заглушку в хранилище DSWoK: изучи тему, напиши заметку в стиле DSWoK, запусти draft-critic-mm, сохрани в нужную папку.

Шаги: прочитать руководство по стилю, выбрать заглушку, grep для перекрёстных ссылок, выбрать папку назначения, написать черновик, затем критику.

Ключевые выводы

Во всех трёх запусках M2.7 был полезен, когда ограничения были явными, а формат вывода — конкретным. Он испытывал трудности, когда важный контекст оставался неявным, хотя у Opus 4.7 иногда были те же пробелы. Для открытых случаев всё ещё рекомендуется проверка человеком. Автор отмечает, что качество модели и дизайн оболочки сложно разделить — более сильная модель может выводить недостающие ограничения, а лучшая оболочка делает их явными.

📖 Читать полный источник: HN AI Agents

Тестирование MiniMax M2.7 через API на трех реальных ML и кодинг-воркфлоу

Настройка

Рабочий процесс 1: Рефакторинг проекта PyTorch

Рабочий процесс 2: Заметки Obsidian Vault

Ключевые выводы

👀 Смотрите также

Мой агент создал себе систему интероцепции — теперь у него есть желания

Плагин Claude Code анализирует потери токенов и аномалии локально.

КОНТАКТ: 3D-игра о морских сражениях, полностью созданная с помощью кода Claude.

CC-Ledger: Отслеживайте затраты Claude Code за сессию и PR с помощью локального SQLite