Test de MiniMax M2.7 via API sur trois workflows ML et codage réels

✍️ OpenClawRadar📅 Publié: May 21, 2026🔗 Source
Test de MiniMax M2.7 via API sur trois workflows ML et codage réels
Ad

Andrey Lukyanenko a testé MiniMax M2.7 sur trois workflows réalistes de ML et codage via l'API, en utilisant Claude Code comme harnais. Objectif : voir comment M2.7 se comporte dans des boucles agentiques par rapport à Claude Opus 4.7.

Configuration

L'environnement de test a enveloppé l'API MiniMax dans une commande claude-mm qui pointe Claude Code vers M2.7 :

claude-mm () {
  ANTHROPIC_BASE_URL = "https://api.minimax.io/anthropic" \
  ANTHROPIC_AUTH_TOKEN = "$MINIMAX_API_KEY" \
  ANTHROPIC_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_DEFAULT_SONNET_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_DEFAULT_OPUS_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_DEFAULT_HAIKU_MODEL = "MiniMax-M2.7" \
  ANTHROPIC_SMALL_FAST_MODEL = "MiniMax-M2.7" \
  API_TIMEOUT_MS = "3000000" \
  CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC = "1" \
  claude "$@"
}

Il a utilisé le niveau Plus de MiniMax (40 $/mois), où la fenêtre de contexte et le débit quotidien étaient suffisants pour un travail agentique multi-étapes.

Workflow 1 : Refactorisation d'un projet PyTorch

La tâche consistait à mettre à jour les dépendances et la qualité du code dans le dépôt pytorch_tempest (Hydra + PyTorch Lightning). Les modifications comprenaient :

  • Mise à jour des versions CI et des hooks pre-commit.
  • Remplacement de black + flake8 par ruff pour le linting et le formatage.
  • Activation de fsdp_sharding_strategy dans la configuration du trainer Lightning.
  • Actualisation de la documentation.
  • Ajout de uv pour la gestion d'environnement.
  • Passage au typage Python moderne (list[X] au lieu de List[X], X | None au lieu de Optional[X]).
  • Suppression des chemins de code dupliqués.

L'approche était progressive : Lukyanenko donnait des exigences explicites, examinait chaque modification et fournissait des retours lorsque le diff sortait du cadre. M2.7 s'adaptait bien car il restait dans des prompts étroits et permettait une révision ligne par ligne. Les échecs CI étaient corrigés de manière itérative avec l'aide de l'agent.

Ad

Workflow 2 : Notes Obsidian

Pour la rédaction et la relecture de notes de référence ML dans Obsidian, Lukyanenko a adapté les prompts spécifiquement pour M2.7. Il a d'abord demandé à M2.7 et Opus 4.7 de générer des notes à partir du même prompt, puis a fait lire les deux sorties par M2.7 et proposer un prompt amélioré pour lui-même. Le prompt résultant (condensé) était :

Remplir un stub de lien cassé dans le coffre DSWoK : rechercher le sujet, rédiger la note dans le style DSWoK, exécuter draft-critic-mm, enregistrer dans le bon dossier.

Étapes : lire le guide de style, choisir un stub, grep pour les références croisées, choisir le dossier de destination, rédiger, puis critiquer.

Résultats clés

Sur les trois essais, M2.7 était utile lorsque les contraintes étaient explicites et le format de sortie concret. Il peinait quand un contexte important était implicite, bien qu'Opus 4.7 présente parfois les mêmes lacunes. Pour les cas ouverts, un passage de révision humaine reste recommandé. L'auteur note que la qualité du modèle et la conception du harnais sont difficiles à séparer — un modèle plus fort peut inférer les contraintes manquantes, tandis qu'un meilleur harnais les rend explicites.

📖 Lire la source complète : HN AI Agents

Ad

👀 See Also

Yozora-fm : Visualisation Galactique Interactive de Musique d'Anime
Tools

Yozora-fm : Visualisation Galactique Interactive de Musique d'Anime

Yozora-fm est une visualisation interactive où chaque étoile représente une chanson d'ouverture ou de fin d'anime, avec plus de 9 000 morceaux cartographiés par genre et époque. Les utilisateurs peuvent cliquer sur les étoiles pour lire des vidéos ou explorer l'interface galactique.

OpenClawRadar
Manifest Ajoute des Plans de Jetons MiniMax avec Prise en Charge du Modèle M2.7
Tools

Manifest Ajoute des Plans de Jetons MiniMax avec Prise en Charge du Modèle M2.7

Manifest, une couche de routage open source pour OpenClaw, prend désormais en charge les forfaits de tokens MiniMax à partir de 10 $/mois. Le nouveau modèle MiniMax M2.7 est spécialement conçu pour les flux de travail OpenClaw et obtient 62,7 sur MM-ClawBench et 56,2 sur SWE-Bench Pro.

OpenClawRadar
Surveillance du quota de code Claude dans la barre système Windows
Tools

Surveillance du quota de code Claude dans la barre système Windows

Une application de la zone de notification Windows qui surveille l'utilisation de Claude Code avec une icône codée par couleur, actualise automatiquement les données de quota toutes les 5 minutes via l'API OAuth d'Anthropic, et fournit des tableaux de bord détaillés montrant les tendances d'utilisation horaires, quotidiennes, hebdomadaires et mensuelles.

OpenClawRadar
Transcription vocale locale pour OpenClaw utilisant Parakeet TDT 0.6b v3
Tools

Transcription vocale locale pour OpenClaw utilisant Parakeet TDT 0.6b v3

Un développeur a converti le modèle Parakeet TDT 0.6b v3 de NVIDIA pour fonctionner localement via ONNX sur CPU, prenant en charge 25 langues européennes. Le modèle fournit un point de terminaison API compatible OpenAI via un conteneur Docker, permettant l'intégration avec OpenClaw pour la transcription de fichiers audio.

OpenClawRadar