Test de MiniMax M2.7 via API sur trois workflows ML et codage réels

Andrey Lukyanenko a testé MiniMax M2.7 sur trois workflows réalistes de ML et codage via l'API, en utilisant Claude Code comme harnais. Objectif : voir comment M2.7 se comporte dans des boucles agentiques par rapport à Claude Opus 4.7.
Configuration
L'environnement de test a enveloppé l'API MiniMax dans une commande claude-mm qui pointe Claude Code vers M2.7 :
claude-mm () {
ANTHROPIC_BASE_URL = "https://api.minimax.io/anthropic" \
ANTHROPIC_AUTH_TOKEN = "$MINIMAX_API_KEY" \
ANTHROPIC_MODEL = "MiniMax-M2.7" \
ANTHROPIC_DEFAULT_SONNET_MODEL = "MiniMax-M2.7" \
ANTHROPIC_DEFAULT_OPUS_MODEL = "MiniMax-M2.7" \
ANTHROPIC_DEFAULT_HAIKU_MODEL = "MiniMax-M2.7" \
ANTHROPIC_SMALL_FAST_MODEL = "MiniMax-M2.7" \
API_TIMEOUT_MS = "3000000" \
CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC = "1" \
claude "$@"
}Il a utilisé le niveau Plus de MiniMax (40 $/mois), où la fenêtre de contexte et le débit quotidien étaient suffisants pour un travail agentique multi-étapes.
Workflow 1 : Refactorisation d'un projet PyTorch
La tâche consistait à mettre à jour les dépendances et la qualité du code dans le dépôt pytorch_tempest (Hydra + PyTorch Lightning). Les modifications comprenaient :
- Mise à jour des versions CI et des hooks pre-commit.
- Remplacement de black + flake8 par ruff pour le linting et le formatage.
- Activation de
fsdp_sharding_strategydans la configuration du trainer Lightning. - Actualisation de la documentation.
- Ajout de uv pour la gestion d'environnement.
- Passage au typage Python moderne (
list[X]au lieu deList[X],X | Noneau lieu deOptional[X]). - Suppression des chemins de code dupliqués.
L'approche était progressive : Lukyanenko donnait des exigences explicites, examinait chaque modification et fournissait des retours lorsque le diff sortait du cadre. M2.7 s'adaptait bien car il restait dans des prompts étroits et permettait une révision ligne par ligne. Les échecs CI étaient corrigés de manière itérative avec l'aide de l'agent.
Workflow 2 : Notes Obsidian
Pour la rédaction et la relecture de notes de référence ML dans Obsidian, Lukyanenko a adapté les prompts spécifiquement pour M2.7. Il a d'abord demandé à M2.7 et Opus 4.7 de générer des notes à partir du même prompt, puis a fait lire les deux sorties par M2.7 et proposer un prompt amélioré pour lui-même. Le prompt résultant (condensé) était :
Remplir un stub de lien cassé dans le coffre DSWoK : rechercher le sujet, rédiger la note dans le style DSWoK, exécuter draft-critic-mm, enregistrer dans le bon dossier.
Étapes : lire le guide de style, choisir un stub, grep pour les références croisées, choisir le dossier de destination, rédiger, puis critiquer.
Résultats clés
Sur les trois essais, M2.7 était utile lorsque les contraintes étaient explicites et le format de sortie concret. Il peinait quand un contexte important était implicite, bien qu'Opus 4.7 présente parfois les mêmes lacunes. Pour les cas ouverts, un passage de révision humaine reste recommandé. L'auteur note que la qualité du modèle et la conception du harnais sont difficiles à séparer — un modèle plus fort peut inférer les contraintes manquantes, tandis qu'un meilleur harnais les rend explicites.
📖 Lire la source complète : HN AI Agents
👀 See Also

Yozora-fm : Visualisation Galactique Interactive de Musique d'Anime
Yozora-fm est une visualisation interactive où chaque étoile représente une chanson d'ouverture ou de fin d'anime, avec plus de 9 000 morceaux cartographiés par genre et époque. Les utilisateurs peuvent cliquer sur les étoiles pour lire des vidéos ou explorer l'interface galactique.

Manifest Ajoute des Plans de Jetons MiniMax avec Prise en Charge du Modèle M2.7
Manifest, une couche de routage open source pour OpenClaw, prend désormais en charge les forfaits de tokens MiniMax à partir de 10 $/mois. Le nouveau modèle MiniMax M2.7 est spécialement conçu pour les flux de travail OpenClaw et obtient 62,7 sur MM-ClawBench et 56,2 sur SWE-Bench Pro.

Surveillance du quota de code Claude dans la barre système Windows
Une application de la zone de notification Windows qui surveille l'utilisation de Claude Code avec une icône codée par couleur, actualise automatiquement les données de quota toutes les 5 minutes via l'API OAuth d'Anthropic, et fournit des tableaux de bord détaillés montrant les tendances d'utilisation horaires, quotidiennes, hebdomadaires et mensuelles.

Transcription vocale locale pour OpenClaw utilisant Parakeet TDT 0.6b v3
Un développeur a converti le modèle Parakeet TDT 0.6b v3 de NVIDIA pour fonctionner localement via ONNX sur CPU, prenant en charge 25 langues européennes. Le modèle fournit un point de terminaison API compatible OpenAI via un conteneur Docker, permettant l'intégration avec OpenClaw pour la transcription de fichiers audio.