Outil Open Source Mesure l'Autonomie des Agents d'IA en Codage avec Analyse de Données Locales

✍️ OpenClawRadar📅 Publié: March 8, 2026🔗 Source
Outil Open Source Mesure l'Autonomie des Agents d'IA en Codage avec Analyse de Données Locales
Ad

Ce que fait Codelens-AI

Codelens-AI est un outil CLI open-source qui lit vos fichiers de session Claude Code locaux et les corrèle avec l'historique git. Au lieu de simplement suivre les coûts, il analyse comment l'agent IA fonctionne réellement en calculant des métriques d'autonomie basées sur vos habitudes d'utilisation.

Métriques clés et résultats d'exemple

Le créateur a exécuté l'outil sur 30 jours d'utilisation personnelle et a partagé ces résultats :

  • Ratio Autopilote : 7,4x — Pour chaque message envoyé à Claude, l'agent effectue 7 actions
  • Score d'Auto-réparation : 1 % — Sur 6 281 commandes bash, seulement 50 étaient des tests ou des vérifications
  • Couverture de la boîte à outils : 81 % — L'agent utilise la plupart des outils disponibles (grep, read, write, bash, search)
  • Vélocité des commits : 114 étapes/commit — Il faut 114 appels d'outils pour produire un commit
  • Score d'Autonomie global : C (36/100)
Ad

Impact pratique et utilisation

Ces métriques ont révélé que bien que l'agent travaille dur (Ratio Autopilote de 7,4x), il vérifie rarement son propre travail (Score d'Auto-réparation de 1 %). Cette observation a incité le créateur à modifier sa stratégie de prompts — il demande maintenant explicitement à Claude d'exécuter des tests après chaque modification, ce qui a augmenté son Score d'Auto-réparation de 1 % à environ 15 % en quelques jours.

Configuration et confidentialité des données

L'outil ne nécessite aucune configuration : npx claude-roi. Toutes les données restent locales — il analyse vos fichiers JSONL de ~/.claude/projects/ ainsi que le journal git. Il n'y a aucun composant cloud et aucune télémétrie.

État du développement et communauté

L'outil recherche activement des suggestions de fonctionnalités, des problèmes et des PR — notamment concernant la formule de notation et l'ajout de la prise en charge des sessions Cursor/Codex. Le créateur est curieux de connaître les scores obtenus par d'autres personnes et si d'autres utilisent cet outil.

GitHub : github.com/Akshat2634/Codelens-AI

Site web : https://codelensai-dev.vercel.app/

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Formateur de messages Slack : Corriger le Markdown cassé de Claude dans Slack
Tools

Formateur de messages Slack : Corriger le Markdown cassé de Claude dans Slack

Un développeur a créé une compétence qui convertit le Markdown généré par Claude en un formatage Slack approprié, résolvant les problèmes où le texte en gras s'affiche avec des astérisques, les liens apparaissent bruts et les tableaux se cassent. L'outil propose à la fois un aperçu navigateur avec copier-coller HTML enrichi et une prise en charge de webhook API.

OpenClawRadar
Système d'ingénierie portable pour Claude Code avec crochets, agents spécialisés et auto-amélioration
Tools

Système d'ingénierie portable pour Claude Code avec crochets, agents spécialisés et auto-amélioration

Un développeur a créé un système d'ingénierie portable qui réside dans ~/.claude/ et s'applique automatiquement à chaque projet, comportant une constitution de 650 lignes, des crochets déterministes qui bloquent les commandes dangereuses, trois agents spécialisés et une approche d'ingénierie composite auto-améliorante.

OpenClawRadar
Krasis LLM Runtime présente des améliorations de vitesse de 8,9x en préremplissage et de 4,7x en décodage par rapport à Llama.cpp.
Tools

Krasis LLM Runtime présente des améliorations de vitesse de 8,9x en préremplissage et de 4,7x en décodage par rapport à Llama.cpp.

Le runtime LLM Krasis exécute désormais entièrement le préremplissage et le décodage sur GPU avec différentes stratégies d'optimisation, obtenant un préremplissage 8,9 fois plus rapide et un décodage 4,7 fois plus rapide que llama.cpp sur Qwen3.5-122B avec un seul GPU 5090.

OpenClawRadar
Dirac : un agent open-source domine TerminalBench avec 65,2 %, moins cher et ouvert
Tools

Dirac : un agent open-source domine TerminalBench avec 65,2 %, moins cher et ouvert

Dirac, un agent de codage open-source, a obtenu un score de 65,2 % sur TerminalBench 2.0 pour gemini-3-flash-preview, surpassant le socle de Google (47,6 %) et le meilleur agent propriétaire Junie CLI (64,3 %). Il réduit également les coûts API de 64,8 % par rapport à ses concurrents.

OpenClawRadar