Codeset améliore les agents de codage avec un contexte spécifique au dépôt provenant de l'historique git.

✍️ OpenClawRadar📅 Publié: April 17, 2026🔗 Source
Codeset améliore les agents de codage avec un contexte spécifique au dépôt provenant de l'historique git.
Ad

Ce que fait Codeset

Codeset exécute un pipeline sur votre historique git et génère des fichiers qui résident directement dans votre dépôt. Ces fichiers incluent : les bugs passés par fichier avec leurs causes racines, les pièges connus, les relations de co-changement et les listes de contrôle de tests. L'agent de codage lit ces fichiers dans le cadre de sa fenêtre de contexte normale. Pas de RAG, pas de base de données vectorielle au moment de la requête, pas d'infrastructure d'exécution requise—juste des fichiers statiques que votre agent récupère comme n'importe quel autre fichier du dépôt.

Ad

Résultats de référence

L'équipe a testé Codeset avec deux références :

  • codeset-gym-python (150 tâches, même sous-ensemble que l'évaluation Claude) : 60,7 % → 66 % (+5,3 points de pourcentage)
  • SWE-Bench Pro (400 tâches échantillonnées aléatoirement) : 56,5 % → 58,5 % (+2 points de pourcentage)

Cela montre une amélioration constante sur les deux références, avec des gains plus faibles sur SWE-Bench Pro par rapport à codeset-gym. La référence codeset-gym est publique avec la liste complète des tâches et des vérificateurs disponibles pour la vérification de la méthodologie.

Tarification et disponibilité

Codeset coûte 5 $ par dépôt, paiement unique. Utilisez le code CODESETLAUNCH pour un essai gratuit. Les artefacts d'évaluation complets sont disponibles sur https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

ThumbGate met en œuvre le modèle de harnais d'agent en langage naturel de Tsinghua pour la sécurité de l'IA
Tools

ThumbGate met en œuvre le modèle de harnais d'agent en langage naturel de Tsinghua pour la sécurité de l'IA

L'outil open-source ThumbGate implémente le schéma Natural-Language Agent Harness du document NLAH de Tsinghua, en associant quatre composants : les contrats aux règles de prévention générées à partir des retours négatifs, les portes de vérification aux crochets PreToolUse, l'état durable à la base de données de leçons SQLite+FTS5, et les adaptateurs aux adaptateurs de serveur MCP pour plusieurs agents d'IA de codage.

OpenClawRadar
Test du Qwen 3.6 27B local en tant que co-agent validateur Codex
Tools

Test du Qwen 3.6 27B local en tant que co-agent validateur Codex

Un développeur a créé une suite d'évaluation reproductible pour tester les profils GGUF de Qwen 3.6 27B (llama.cpp) en tant que validateur secondaire pour Codex, constatant que les profils avec contexte 128k sont nécessaires pour les tâches long-contexte et qu'il y a une perte de précision minimale avec le cache KV q8.

OpenClawRadar
Architecture de Chat Parallèle Claude pour le Développement Next.js
Tools

Architecture de Chat Parallèle Claude pour le Développement Next.js

Un développeur a créé un système pour exécuter simultanément plusieurs conversations Claude IA sur la même base de code Next.js en utilisant une table de base de données partagée et un agent de surveillance, obtenant un taux de réussite de compilation de 87 % sans conflits de fusion lors d'une session.

OpenClawRadar
Centre de Sessions d'Agent IA : Tableau de bord 3D pour la surveillance des sessions de code Claude
Tools

Centre de Sessions d'Agent IA : Tableau de bord 3D pour la surveillance des sessions de code Claude

Le Centre de Sessions d'Agents IA est un tableau de bord en temps réel qui visualise les sessions Claude Code sous forme de robots 3D dans un cyberdrome, avec des animations montrant l'état des agents et des fonctionnalités incluant des vues terminal en direct, des alertes d'approbation et la reprise de session. Il s'installe via npx avec des hooks bash légers.

OpenClawRadar