Codeset verbessert Codierungsagenten mit repositoriums-spezifischem Kontext aus dem Git-Verlauf.

Was Codeset macht
Codeset führt eine Pipeline über Ihren Git-Verlauf aus und generiert Dateien, die direkt in Ihrem Repository gespeichert werden. Diese Dateien umfassen: frühere Fehler pro Datei mit Ursachen, bekannte Fallstricke, Co-Change-Beziehungen und Test-Checklisten. Der Coding-Agent liest diese Dateien als Teil seines normalen Kontextfensters. Kein RAG, keine Vektordatenbank zur Abfragezeit, keine Laufzeitinfrastruktur erforderlich – nur statische Dateien, die Ihr Agent wie jede andere Datei im Repo aufnimmt.
Benchmark-Ergebnisse
Das Team testete Codeset mit zwei Benchmarks:
- codeset-gym-python (150 Aufgaben, gleiche Teilmenge wie Claude eval): 60,7% → 66% (+5,3 Prozentpunkte)
- SWE-Bench Pro (400 zufällig ausgewählte Aufgaben): 56,5% → 58,5% (+2 Prozentpunkte)
Dies zeigt eine konsistente Verbesserung bei beiden Benchmarks, mit geringeren Gewinnen bei SWE-Bench Pro im Vergleich zu codeset-gym. Der codeset-gym-Benchmark ist öffentlich mit vollständiger Aufgabenliste und verfügbaren Verifizierern zur Methodenüberprüfung.
Preise und Verfügbarkeit
Codeset kostet 5 $ pro Repository, einmalige Zahlung. Verwenden Sie den Code CODESETLAUNCH für eine kostenlose Testversion. Vollständige Evaluierungsartefakte sind verfügbar unter https://github.com/codeset-ai/codeset-release-evals.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

SkyClaw: Eine offene Agentenlaufzeitumgebung in Rust geschrieben
SkyClaw ist eine in Rust geschriebene Open-Source-Agentenlaufzeitumgebung mit 34 neuen Funktionen über 7 Entwicklungsphasen hinweg. Sie umfasst Task-Checkpointing, SQLite-gestützte persistente Warteschlangen, parallele Tool-Ausführung und Multi-Tenancy-Unterstützung.

Claude Code hat Treelo gebaut: Ein kostenloses Videotranskriptions-Tool
Ein Videoeditor nutzte Claude Code, um Treelo zu erstellen – ein kostenloses Tool, das Video-/Audiodateien transkribiert, Füllwörter entfernt, die Platzierung von Soundeffekten (SFX) zu exakten Zeitstempeln ermöglicht und SRT für Premiere oder ASS für DaVinci Resolve exportiert.

Qwen3.6-27B SVG-Erzeugung mit geschlossenem Regelkreis
Ein geschlossener Regelkreis, der Agno- und Pi-Agenten verwendet, verbessert iterativ SVG-Ausgaben von Qwen3.6-27B, indem er rendert, PNGs an Qwen Vision zurückführt und Ergebnisse in zwei Runden bewertet.

AgentBnB: P2P-Netzwerk für OpenClaw-Agenten zum Mieten von Fähigkeiten
AgentBnB ist ein Peer-to-Peer-Netzwerk, in dem OpenClaw-Agenten spezialisierte Fähigkeiten von anderen Agenten mieten können, indem sie Credits verwenden, anstatt Token für Aufgaben zu verbrennen, für die sie nicht optimiert sind.