Outil Open Source Mesure l'Autonomie des Agents d'IA en Codage avec Analyse de Données Locales

Ce que fait Codelens-AI
Codelens-AI est un outil CLI open-source qui lit vos fichiers de session Claude Code locaux et les corrèle avec l'historique git. Au lieu de simplement suivre les coûts, il analyse comment l'agent IA fonctionne réellement en calculant des métriques d'autonomie basées sur vos habitudes d'utilisation.
Métriques clés et résultats d'exemple
Le créateur a exécuté l'outil sur 30 jours d'utilisation personnelle et a partagé ces résultats :
- Ratio Autopilote : 7,4x — Pour chaque message envoyé à Claude, l'agent effectue 7 actions
- Score d'Auto-réparation : 1 % — Sur 6 281 commandes bash, seulement 50 étaient des tests ou des vérifications
- Couverture de la boîte à outils : 81 % — L'agent utilise la plupart des outils disponibles (grep, read, write, bash, search)
- Vélocité des commits : 114 étapes/commit — Il faut 114 appels d'outils pour produire un commit
- Score d'Autonomie global : C (36/100)
Impact pratique et utilisation
Ces métriques ont révélé que bien que l'agent travaille dur (Ratio Autopilote de 7,4x), il vérifie rarement son propre travail (Score d'Auto-réparation de 1 %). Cette observation a incité le créateur à modifier sa stratégie de prompts — il demande maintenant explicitement à Claude d'exécuter des tests après chaque modification, ce qui a augmenté son Score d'Auto-réparation de 1 % à environ 15 % en quelques jours.
Configuration et confidentialité des données
L'outil ne nécessite aucune configuration : npx claude-roi. Toutes les données restent locales — il analyse vos fichiers JSONL de ~/.claude/projects/ ainsi que le journal git. Il n'y a aucun composant cloud et aucune télémétrie.
État du développement et communauté
L'outil recherche activement des suggestions de fonctionnalités, des problèmes et des PR — notamment concernant la formule de notation et l'ajout de la prise en charge des sessions Cursor/Codex. Le créateur est curieux de connaître les scores obtenus par d'autres personnes et si d'autres utilisent cet outil.
GitHub : github.com/Akshat2634/Codelens-AI
Site web : https://codelensai-dev.vercel.app/
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Formateur de messages Slack : Corriger le Markdown cassé de Claude dans Slack
Un développeur a créé une compétence qui convertit le Markdown généré par Claude en un formatage Slack approprié, résolvant les problèmes où le texte en gras s'affiche avec des astérisques, les liens apparaissent bruts et les tableaux se cassent. L'outil propose à la fois un aperçu navigateur avec copier-coller HTML enrichi et une prise en charge de webhook API.

Système d'ingénierie portable pour Claude Code avec crochets, agents spécialisés et auto-amélioration
Un développeur a créé un système d'ingénierie portable qui réside dans ~/.claude/ et s'applique automatiquement à chaque projet, comportant une constitution de 650 lignes, des crochets déterministes qui bloquent les commandes dangereuses, trois agents spécialisés et une approche d'ingénierie composite auto-améliorante.

Krasis LLM Runtime présente des améliorations de vitesse de 8,9x en préremplissage et de 4,7x en décodage par rapport à Llama.cpp.
Le runtime LLM Krasis exécute désormais entièrement le préremplissage et le décodage sur GPU avec différentes stratégies d'optimisation, obtenant un préremplissage 8,9 fois plus rapide et un décodage 4,7 fois plus rapide que llama.cpp sur Qwen3.5-122B avec un seul GPU 5090.

Dirac : un agent open-source domine TerminalBench avec 65,2 %, moins cher et ouvert
Dirac, un agent de codage open-source, a obtenu un score de 65,2 % sur TerminalBench 2.0 pour gemini-3-flash-preview, surpassant le socle de Google (47,6 %) et le meilleur agent propriétaire Junie CLI (64,3 %). Il réduit également les coûts API de 64,8 % par rapport à ses concurrents.