Claude Code fügt Multi-Agenten-Code-Review-System hinzu

Code Review für Claude Code
Anthropic hat Code Review für Claude Code eingeführt, ein Multi-Agenten-Überprüfungssystem, das auf internen Prozessen basiert. Verfügbar in der Forschungsvorschau für Team- und Enterprise-Pläne, soll es den Engpass bei der Code-Überprüfung angehen, da die Code-Ausgabe pro Anthropic-Ingenieur im letzten Jahr um 200 % gestiegen ist.
Wie es funktioniert
Wenn ein PR geöffnet wird, setzt Code Review ein Team von Agenten ein, die parallel nach Fehlern suchen, Fehler verifizieren, um falsch-positive Meldungen herauszufiltern, und Fehler nach Schweregrad einstufen. Die Ergebnisse erscheinen als einzelner hochwertiger Überblickskommentar plus Inline-Kommentare für spezifische Fehler. Die Überprüfungen skalieren mit der PR-Größe: große oder komplexe Änderungen erhalten mehr Agenten und tiefere Analysen, während triviale Änderungen leichte Prüfungen erhalten.
Die durchschnittliche Überprüfung dauert laut Anthropics Tests etwa 20 Minuten. Das System genehmigt keine PRs – das bleibt eine menschliche Entscheidung – zielt aber darauf ab, die Lücke zu schließen, damit Prüfer besser abdecken können, was ausgeliefert wird.
Leistungsmetriken
- Vor der Implementierung: 16 % der PRs erhielten substantielle Überprüfungskommentare
- Nach der Implementierung: 54 % der PRs erhalten substantielle Überprüfungskommentare
- Große PRs (über 1.000 geänderte Zeilen): 84 % erhalten Funde, durchschnittlich 7,5 Probleme
- Kleine PRs (unter 50 Zeilen): 31 % erhalten Funde, durchschnittlich 0,5 Probleme
- Ingenieur-Übereinstimmungsrate: weniger als 1 % der Funde als falsch markiert
Praktische Beispiele
In einem Fall markierte Code Review eine einzeilige Änderung an einem Produktionsdienst als kritisch – sie hätte die Authentifizierung für den Dienst unterbrochen. Der Ingenieur teilte mit, dass er es selbst nicht erkannt hätte.
Frühe Zugangskunden haben ähnliche Muster beobachtet. Bei einer ZFS-Verschlüsselungs-Refaktorisierung in TrueNAS' Open-Source-Middleware deckte Code Review einen bereits bestehenden Fehler im benachbarten Code auf: eine Typinkongruenz, die bei jedem Sync den Verschlüsselungsschlüssel-Cache stillschweigend löschte.
Kosten und Kontrolle
Code Review ist teurer als die bestehende Claude Code GitHub Action (die Open Source bleibt). Überprüfungen werden nach Token-Verbrauch abgerechnet und liegen im Durchschnitt bei 15–25 US-Dollar, skaliert mit PR-Größe und Komplexität. Administratoren haben mehrere Kontrolloptionen:
- Monatliche Organisationsobergrenzen für Gesamtausgaben
- Repository-Level-Kontrolle, um Überprüfungen nur für ausgewählte Repositorys zu aktivieren
- Analytics-Dashboard zur Verfolgung überprüfter PRs, Akzeptanzrate und Gesamtprüfkosten
Erste Schritte
Für Administratoren: Aktivieren Sie Code Review in den Claude Code-Einstellungen, installieren Sie die GitHub-App und wählen Sie Repositorys aus. Für Entwickler: Einmal aktiviert, laufen Überprüfungen automatisch bei neuen PRs ohne Konfiguration.
📖 Read the full source: HN AI Agents
👀 Siehe auch

skillcheck: Ein Linter für SKILL.md-Dateien, der plattformübergreifende Kompatibilitätsprobleme erkennt
skillcheck ist ein Python-Tool, das SKILL.md-Dateien gemäß der agentskills.io-Spezifikation validiert und bietet einzigartige Funktionen wie Bewertung der Beschreibungsqualität, Warnungen zu Claude-spezifischen Feldern und Überprüfung von Dateiverweisen, die in bestehenden Validatoren nicht verfügbar sind.

YouTube-Transkript MCP verbessert den Claude-Forschungs-Workflow
Ein YouTube-Transkript-MCP ermöglicht es Claude, vollständige Transkripte mit Zeitstempeln von YouTube-Links abzurufen, wodurch manuelles Wechseln zwischen Tabs und Kopieren-Einfügen entfällt. Der Nutzer berichtet von deutlich besseren Antworten, wenn Claude tatsächliche Transkripte anstelle von Nutzerzusammenfassungen hat.

Crit: Lokal-first, Single-Binary CLI zur Überprüfung von Agentenplänen und Diffs
Crit ist ein Single-Binary-CLI-Tool, das Dateien oder Diffs mit einer von GitHub inspirierten Benutzeroberfläche im Browser öffnet und mehrstufige Feedback-Schleifen mit KI-Coding-Agenten ermöglicht – kein Konto erforderlich.

ProofShot CLI verleiht KI-Codierungsagenten Browser-Verifizierungsfunktionen
ProofShot ist ein Open-Source-CLI-Tool, das KI-Coding-Agents ermöglicht, UI-Funktionen zu überprüfen, indem es Browser-Sitzungen aufzeichnet, Screenshots erfasst und Konsolenfehler sammelt. Es funktioniert mit jedem Agenten, der Shell-Befehle ausführen kann, und erstellt eigenständige HTML-Berichte zur menschlichen Überprüfung.