Codeset améliore les agents de codage avec un contexte spécifique au dépôt provenant de l'historique git.

✍️ OpenClawRadar📅 Publié: April 17, 2026🔗 Source

Ce que fait Codeset

Codeset exécute un pipeline sur votre historique git et génère des fichiers qui résident directement dans votre dépôt. Ces fichiers incluent : les bugs passés par fichier avec leurs causes racines, les pièges connus, les relations de co-changement et les listes de contrôle de tests. L'agent de codage lit ces fichiers dans le cadre de sa fenêtre de contexte normale. Pas de RAG, pas de base de données vectorielle au moment de la requête, pas d'infrastructure d'exécution requise—juste des fichiers statiques que votre agent récupère comme n'importe quel autre fichier du dépôt.

Résultats de référence

L'équipe a testé Codeset avec deux références :

codeset-gym-python (150 tâches, même sous-ensemble que l'évaluation Claude) : 60,7 % → 66 % (+5,3 points de pourcentage)
SWE-Bench Pro (400 tâches échantillonnées aléatoirement) : 56,5 % → 58,5 % (+2 points de pourcentage)

Cela montre une amélioration constante sur les deux références, avec des gains plus faibles sur SWE-Bench Pro par rapport à codeset-gym. La référence codeset-gym est publique avec la liste complète des tâches et des vérificateurs disponibles pour la vérification de la méthodologie.

Tarification et disponibilité

Codeset coûte 5 $ par dépôt, paiement unique. Utilisez le code CODESETLAUNCH pour un essai gratuit. Les artefacts d'évaluation complets sont disponibles sur https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

👀 See Also

Tools

Manifest Ajoute des Plans de Jetons MiniMax avec Prise en Charge du Modèle M2.7

Manifest, une couche de routage open source pour OpenClaw, prend désormais en charge les forfaits de tokens MiniMax à partir de 10 $/mois. Le nouveau modèle MiniMax M2.7 est spécialement conçu pour les flux de travail OpenClaw et obtient 62,7 sur MM-ClawBench et 56,2 sur SWE-Bench Pro.

Mar 21, 2026, 03:45 AM UTC

OpenClawRadar

Tools

GuppyLM : Un LLM de 9M paramètres construit à partir de zéro à des fins éducatives

GuppyLM est un modèle de langage d'environ 9 millions de paramètres entraîné à partir de zéro sur 60 000 conversations synthétiques, utilisant une architecture de transformateur classique avec 6 couches, 384 dimensions cachées et 6 têtes d'attention. Il s'entraîne en environ 5 minutes sur un GPU T4 Colab gratuit et parle avec une personnalité de poisson axée sur l'eau, la nourriture et la vie en aquarium.

Apr 16, 2026, 12:15 PM UTC

OpenClawRadar

Tools

Recherche de mémoire sémantique locale pour agents OpenClaw utilisant les embeddings Harrier

Exécutez un serveur d'embedding local avec le modèle Harrier de Microsoft, exposez une API compatible avec Ollama, et configurez memorySearch d'OpenClaw pour une recherche de mémoire sémantique locale sans services externes.

Jun 7, 2026, 12:15 AM UTC

OpenClawRadar

Tools

Spécialiste open-source, l'adaptateur Dispatch délègue les tâches complexes à Claude Code.

expert-dispatch est un script bash d'environ 500 lignes qui permet à une IA d'assistance bon marché de déléguer des tâches de codage complexes à Claude Code CLI. Il utilise des commandes comme dispatch-cc run pour envoyer des tâches et maintient des répertoires par projet avec CLAUDE.md pour un contexte persistant.

Apr 20, 2026, 08:23 PM UTC

OpenClawRadar