Kimi K2.6 contre Claude Opus 4.7 : Test pratique avec un mod de panneau de quêtes pour Minetest

Comparaison intéressante en conditions réelles de deux modèles sur une tâche de codage étrange : construire un mod de jeu de panneau de primes Minetest/Luanti avec un backend TypeScript, puis l'étendre avec une journalisation Google Sheets via Composio. Les deux modèles ont reçu les mêmes instructions. Détails dans le post source.
Configuration
- Claude Opus 4.7 : via Claude Code
- Kimi K2.6 : via OpenCode sur OpenRouter
- Tâche : le joueur rejoint le monde, exécute
/bounty, obtient une tâche, la complète, reçoit une récompense, le backend enregistre l'achèvement. Deuxième test : enregistrer les achèvements dans Google Sheets via Composio.
Tarifs
- Opus 4.7 : 5 $/M en entrée, 25 $/M en sortie
- Kimi K2.6 : 0,95 $/M en entrée, 4 $/M en sortie (entrée en cache 0,16 $/M)
Test 1 : Panneau de primes local
Opus 4.7 : MVP propre. Backend Express/Zod/Vitest, mod Lua, flux /bounty, récompenses, classement, tests réussis. Statistiques :
- Coût : ~3,59 $
- Temps : 12 min API, 23 min chrono
- Code : +1 688 / -0
- Jetons de sortie : 54,8k
- Lecture cache : 2,8M
Kimi K2.6 : A aussi fait fonctionner le panneau local, mais plus brouillon. A écrit 4 671 lignes de code (+4 671 / -0) contre 1 688 pour Opus — plus de 2 fois plus de code. Coût : ~0,39 $. Temps : ~9 min 27 s. La partie agaçante : la configuration Minetest. Il a écrit secure.http_mods = bountykimi dans la configuration globale, mais a créé une configuration au niveau du monde avec un nom de mod différent, donc l'API HTTP n'était pas activée pour le mod en cours d'exécution. Le testeur a passé plus de 30 minutes à déboguer.
Test 2 : Composio + Google Sheets
Opus 4.7 : Synchronisation Google Sheets fonctionnelle. Après quelques allers-retours sur tsx watch et le chargement des variables d'environnement, le backend a pu compléter une prime et l'ajouter dans Sheets. Statistiques :
- Coût : 16,03 $
- Temps : 28 min API, 1 h 17 min chrono
- Code : +1 848 / -507
- Lecture cache : 22,3M
- Sortie : 123,3k jetons
Kimi K2.6 : Échec. Bloqué sur des problèmes de serveur de développement, de tests, de construction. N'a jamais intégré Composio dans un état fonctionnel. Après environ 25 min et plus de 135k jetons, le testeur a arrêté. Coût : ~5,03 $.
En résumé
- Meilleur MVP local : Opus, mais Kimi offre un bien meilleur rapport qualité-prix
- Meilleure intégration réelle : Opus, de loin
- Code plus propre : Opus
- Modèle d'expérimentation moins cher : Kimi
Les tests montrent que Kimi K2.6 est intéressant pour des tâches de codage locales moins coûteuses — pour 0,39 $, obtenir un mod Lua+TypeScript fonctionnel n'est pas mal. Mais une fois que la tâche implique des outils externes, des problèmes de configuration et un travail d'intégration réel, Opus 4.7 était clairement en tête.
Analyse complète avec commits, captures d'écran, démos et coûts sur le lien source.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Titre de l'article traduit : Mises à jour des invites système de Claude Code : Nouveau rappel de modification de fichier et clarifications REPL, rappel d'analyse de malware supprimé
Les versions 2.1.124 (+166 tokens) et 2.1.126 (-87 tokens) de Claude Code (CC) mettent à jour le prompt système : ajout d'une détection de modification de fichier avec avertissement de dépassement de budget, remplacement de la fonction core-identity par des instructions explicites du harness, clarification du comportement d'auto-attente des thenables dans le REPL, et suppression du rappel d'analyse de malware.

Projet de Norme C++26 Finalisé avec Réflexion, Sécurité Mémoire, Contrats et Cadre Asynchrone
L'ébauche de la norme C++26 est terminée, introduisant la réflexion pour la métaprogrammation, une sécurité mémoire améliorée qui élimine le comportement indéfini pour les variables non initialisées et ajoute une sécurité des limites pour les types de la bibliothèque standard, les contrats avec pré/post-conditions, et std::execution pour la concurrence.

Utilisateurs d'OpenClaw Signalent des Remplacements de Modèles Après l'Interdiction d'Anthropic
Une enquête communautaire sur Reddit, X, YouTube et GitHub révèle que GPT-5.x est le remplaçant le plus adopté pour Claude dans les workflows OpenClaw, avec Kimi K2.5 en tête des votes communautaires et les configurations hybrides gagnant en popularité.

Modifications du Plan Individuel GitHub Copilot : Inscriptions suspendues, limites renforcées, ajustements du modèle
GitHub suspend temporairement les nouvelles inscriptions pour les plans Copilot Pro, Pro+ et Étudiant tout en resserrant les limites d'utilisation et en retirant les modèles Opus des plans Pro. Ces changements répondent à l'augmentation des besoins en calcul des workflows agentiques.