Codeset verbessert Codierungsagenten mit repositoriums-spezifischem Kontext aus dem Git-Verlauf.

Was Codeset macht
Codeset führt eine Pipeline über Ihren Git-Verlauf aus und generiert Dateien, die direkt in Ihrem Repository gespeichert werden. Diese Dateien umfassen: frühere Fehler pro Datei mit Ursachen, bekannte Fallstricke, Co-Change-Beziehungen und Test-Checklisten. Der Coding-Agent liest diese Dateien als Teil seines normalen Kontextfensters. Kein RAG, keine Vektordatenbank zur Abfragezeit, keine Laufzeitinfrastruktur erforderlich – nur statische Dateien, die Ihr Agent wie jede andere Datei im Repo aufnimmt.
Benchmark-Ergebnisse
Das Team testete Codeset mit zwei Benchmarks:
- codeset-gym-python (150 Aufgaben, gleiche Teilmenge wie Claude eval): 60,7% → 66% (+5,3 Prozentpunkte)
- SWE-Bench Pro (400 zufällig ausgewählte Aufgaben): 56,5% → 58,5% (+2 Prozentpunkte)
Dies zeigt eine konsistente Verbesserung bei beiden Benchmarks, mit geringeren Gewinnen bei SWE-Bench Pro im Vergleich zu codeset-gym. Der codeset-gym-Benchmark ist öffentlich mit vollständiger Aufgabenliste und verfügbaren Verifizierern zur Methodenüberprüfung.
Preise und Verfügbarkeit
Codeset kostet 5 $ pro Repository, einmalige Zahlung. Verwenden Sie den Code CODESETLAUNCH für eine kostenlose Testversion. Vollständige Evaluierungsartefakte sind verfügbar unter https://github.com/codeset-ai/codeset-release-evals.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch
Claude Code vs. Codex: 36 vs. 28 Dateien, 2,50 $ vs. 2,04 $, Endlosschleife erkannt — Praxisvergleich
Ein Entwickler führt die gleichen zwei Aufgaben mit Claude Code und Codex (Cursor) aus: PR-Triage-Bot und Echtzeit-Code-Review-UI. Ergebnisse: 36 vs. 28 Dateien, 2,50 $ vs. 2,04 $ Kosten, Claude produzierte weniger TypeScript-Fehler, Codex hatte eine Endlosschleife in React.

Claude Skills überschreibt stillschweigend Anweisungen: Undokumentierte Fallstricke aufgedeckt
Ein Reddit-Nutzer, der Claude Skills untersucht, hat mehrere stille Verhaltensweisen entdeckt, die explizite Anweisungen überschreiben, ohne dass eine Dokumentation in <code>skill-creator</code> vorhanden ist. Hier ist, was er gefunden hat.

Open-Source-Browser-Tool zum Testen von MCP-Server ohne Installation
Ein Open-Source-Webtool namens MCP Playground ermöglicht es Entwicklern, MCP-Server direkt in ihrem Browser mithilfe von WebContainers, einer WASM Node.js-Laufzeitumgebung, zu testen. Es kann npm-basierte MCP-Server lokal ohne Backend-Installation ausführen und über URL mit entfernten Servern verbinden.

SiteTest.ai bringt einen kostenlosen AI Visibility Checker für ChatGPT, Perplexity & Gemini auf den Markt
Das neue kostenlose Tool sitetest.ai führt ein 168-Punkte-GEO-Audit durch und testet GPTBot, PerplexityBot und Google-Extended auf Ihrem echten Server. Pro Engine eine Note von A bis F sowie kopierbare Code-Fixes.