Kimi K2.6 vs Claude Opus 4.7 : Test mod panneau quêtes Minetest

Comparaison intéressante en conditions réelles de deux modèles sur une tâche de codage étrange : construire un mod de jeu de panneau de primes Minetest/Luanti avec un backend TypeScript, puis l'étendre avec une journalisation Google Sheets via Composio. Les deux modèles ont reçu les mêmes instructions. Détails dans le post source.

Configuration

Claude Opus 4.7 : via Claude Code
Kimi K2.6 : via OpenCode sur OpenRouter
Tâche : le joueur rejoint le monde, exécute /bounty, obtient une tâche, la complète, reçoit une récompense, le backend enregistre l'achèvement. Deuxième test : enregistrer les achèvements dans Google Sheets via Composio.

Tarifs

Opus 4.7 : 5 $/M en entrée, 25 $/M en sortie
Kimi K2.6 : 0,95 $/M en entrée, 4 $/M en sortie (entrée en cache 0,16 $/M)

Test 1 : Panneau de primes local

Opus 4.7 : MVP propre. Backend Express/Zod/Vitest, mod Lua, flux /bounty, récompenses, classement, tests réussis. Statistiques :

Coût : ~3,59 $
Temps : 12 min API, 23 min chrono
Code : +1 688 / -0
Jetons de sortie : 54,8k
Lecture cache : 2,8M

Kimi K2.6 : A aussi fait fonctionner le panneau local, mais plus brouillon. A écrit 4 671 lignes de code (+4 671 / -0) contre 1 688 pour Opus — plus de 2 fois plus de code. Coût : ~0,39 $. Temps : ~9 min 27 s. La partie agaçante : la configuration Minetest. Il a écrit secure.http_mods = bountykimi dans la configuration globale, mais a créé une configuration au niveau du monde avec un nom de mod différent, donc l'API HTTP n'était pas activée pour le mod en cours d'exécution. Le testeur a passé plus de 30 minutes à déboguer.

Test 2 : Composio + Google Sheets

Opus 4.7 : Synchronisation Google Sheets fonctionnelle. Après quelques allers-retours sur tsx watch et le chargement des variables d'environnement, le backend a pu compléter une prime et l'ajouter dans Sheets. Statistiques :

Coût : 16,03 $
Temps : 28 min API, 1 h 17 min chrono
Code : +1 848 / -507
Lecture cache : 22,3M
Sortie : 123,3k jetons

Kimi K2.6 : Échec. Bloqué sur des problèmes de serveur de développement, de tests, de construction. N'a jamais intégré Composio dans un état fonctionnel. Après environ 25 min et plus de 135k jetons, le testeur a arrêté. Coût : ~5,03 $.

En résumé

Meilleur MVP local : Opus, mais Kimi offre un bien meilleur rapport qualité-prix
Meilleure intégration réelle : Opus, de loin
Code plus propre : Opus
Modèle d'expérimentation moins cher : Kimi

Les tests montrent que Kimi K2.6 est intéressant pour des tâches de codage locales moins coûteuses — pour 0,39 $, obtenir un mod Lua+TypeScript fonctionnel n'est pas mal. Mais une fois que la tâche implique des outils externes, des problèmes de configuration et un travail d'intégration réel, Opus 4.7 était clairement en tête.

Analyse complète avec commits, captures d'écran, démos et coûts sur le lien source.

📖 Lire la source complète : r/ClaudeAI

Kimi K2.6 contre Claude Opus 4.7 : Test pratique avec un mod de panneau de quêtes pour Minetest

Configuration

Tarifs

Test 1 : Panneau de primes local

Test 2 : Composio + Google Sheets

En résumé

👀 See Also

Google Chrome installe silencieusement le modèle IA Gemini Nano de 4 Go – sans consentement de l'utilisateur

Dette cognitive : Quand la production de l'IA dépasse la compréhension

Étude sur l'IA Cursor : Les gains de vitesse à court terme entraînent une complexité à long terme

Fondateur d'OpenClaw, Peter Steinberger, sous les projecteurs : Retour sur l'entretien YC