Codeset verbessert Codierungsagenten: +5,3% mit Git-Kontext

Was Codeset macht

Codeset führt eine Pipeline über Ihren Git-Verlauf aus und generiert Dateien, die direkt in Ihrem Repository gespeichert werden. Diese Dateien umfassen: frühere Fehler pro Datei mit Ursachen, bekannte Fallstricke, Co-Change-Beziehungen und Test-Checklisten. Der Coding-Agent liest diese Dateien als Teil seines normalen Kontextfensters. Kein RAG, keine Vektordatenbank zur Abfragezeit, keine Laufzeitinfrastruktur erforderlich – nur statische Dateien, die Ihr Agent wie jede andere Datei im Repo aufnimmt.

Benchmark-Ergebnisse

Das Team testete Codeset mit zwei Benchmarks:

codeset-gym-python (150 Aufgaben, gleiche Teilmenge wie Claude eval): 60,7% → 66% (+5,3 Prozentpunkte)
SWE-Bench Pro (400 zufällig ausgewählte Aufgaben): 56,5% → 58,5% (+2 Prozentpunkte)

Dies zeigt eine konsistente Verbesserung bei beiden Benchmarks, mit geringeren Gewinnen bei SWE-Bench Pro im Vergleich zu codeset-gym. Der codeset-gym-Benchmark ist öffentlich mit vollständiger Aufgabenliste und verfügbaren Verifizierern zur Methodenüberprüfung.

Preise und Verfügbarkeit

Codeset kostet 5 $ pro Repository, einmalige Zahlung. Verwenden Sie den Code CODESETLAUNCH für eine kostenlose Testversion. Vollständige Evaluierungsartefakte sind verfügbar unter https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

Codeset verbessert Codierungsagenten mit repositoriums-spezifischem Kontext aus dem Git-Verlauf.

Was Codeset macht

Benchmark-Ergebnisse

Preise und Verfügbarkeit

👀 Siehe auch

Benutzerdefinierte llama.cpp-Backend verlagert LLM-Matrixmultiplikation auf AMD XDNA2 NPU in Ryzen AI MAX 385

RUNE-Protokoll: Speichern Sie KI-Sitzungsspeicher plattformübergreifend

KANBAII: Ein visuelles Kanban-Board, entwickelt mit Claude Code für KI-unterstützte Entwicklung

Blender MCP Server mit über 100 Tools, erstellt mit Claude Code