Codeset verbessert Codierungsagenten mit repositoriums-spezifischem Kontext aus dem Git-Verlauf.

✍️ OpenClawRadar📅 Veröffentlicht: 17. April 2026🔗 Source
Codeset verbessert Codierungsagenten mit repositoriums-spezifischem Kontext aus dem Git-Verlauf.
Ad

Was Codeset macht

Codeset führt eine Pipeline über Ihren Git-Verlauf aus und generiert Dateien, die direkt in Ihrem Repository gespeichert werden. Diese Dateien umfassen: frühere Fehler pro Datei mit Ursachen, bekannte Fallstricke, Co-Change-Beziehungen und Test-Checklisten. Der Coding-Agent liest diese Dateien als Teil seines normalen Kontextfensters. Kein RAG, keine Vektordatenbank zur Abfragezeit, keine Laufzeitinfrastruktur erforderlich – nur statische Dateien, die Ihr Agent wie jede andere Datei im Repo aufnimmt.

Benchmark-Ergebnisse

Das Team testete Codeset mit zwei Benchmarks:

  • codeset-gym-python (150 Aufgaben, gleiche Teilmenge wie Claude eval): 60,7% → 66% (+5,3 Prozentpunkte)
  • SWE-Bench Pro (400 zufällig ausgewählte Aufgaben): 56,5% → 58,5% (+2 Prozentpunkte)

Dies zeigt eine konsistente Verbesserung bei beiden Benchmarks, mit geringeren Gewinnen bei SWE-Bench Pro im Vergleich zu codeset-gym. Der codeset-gym-Benchmark ist öffentlich mit vollständiger Aufgabenliste und verfügbaren Verifizierern zur Methodenüberprüfung.

Ad

Preise und Verfügbarkeit

Codeset kostet 5 $ pro Repository, einmalige Zahlung. Verwenden Sie den Code CODESETLAUNCH für eine kostenlose Testversion. Vollständige Evaluierungsartefakte sind verfügbar unter https://github.com/codeset-ai/codeset-release-evals.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

🦀
Werkzeuge

Claude Code vs. Codex: 36 vs. 28 Dateien, 2,50 $ vs. 2,04 $, Endlosschleife erkannt — Praxisvergleich

Ein Entwickler führt die gleichen zwei Aufgaben mit Claude Code und Codex (Cursor) aus: PR-Triage-Bot und Echtzeit-Code-Review-UI. Ergebnisse: 36 vs. 28 Dateien, 2,50 $ vs. 2,04 $ Kosten, Claude produzierte weniger TypeScript-Fehler, Codex hatte eine Endlosschleife in React.

OpenClawRadar
Claude Skills überschreibt stillschweigend Anweisungen: Undokumentierte Fallstricke aufgedeckt
Werkzeuge

Claude Skills überschreibt stillschweigend Anweisungen: Undokumentierte Fallstricke aufgedeckt

Ein Reddit-Nutzer, der Claude Skills untersucht, hat mehrere stille Verhaltensweisen entdeckt, die explizite Anweisungen überschreiben, ohne dass eine Dokumentation in <code>skill-creator</code> vorhanden ist. Hier ist, was er gefunden hat.

OpenClawRadar
Open-Source-Browser-Tool zum Testen von MCP-Server ohne Installation
Werkzeuge

Open-Source-Browser-Tool zum Testen von MCP-Server ohne Installation

Ein Open-Source-Webtool namens MCP Playground ermöglicht es Entwicklern, MCP-Server direkt in ihrem Browser mithilfe von WebContainers, einer WASM Node.js-Laufzeitumgebung, zu testen. Es kann npm-basierte MCP-Server lokal ohne Backend-Installation ausführen und über URL mit entfernten Servern verbinden.

OpenClawRadar
SiteTest.ai bringt einen kostenlosen AI Visibility Checker für ChatGPT, Perplexity & Gemini auf den Markt
Werkzeuge

SiteTest.ai bringt einen kostenlosen AI Visibility Checker für ChatGPT, Perplexity & Gemini auf den Markt

Das neue kostenlose Tool sitetest.ai führt ein 168-Punkte-GEO-Audit durch und testet GPTBot, PerplexityBot und Google-Extended auf Ihrem echten Server. Pro Engine eine Note von A bis F sowie kopierbare Code-Fixes.

sitetest.ai team