KI nutzen, um besseren Code langsamer zu schreiben: Ein Workflow zur Fehlersuche

Entwickler, die von KI-„Slop Cannons“ genervt sind, könnten Nolan Lawsons Alternative schätzen: LLMs nutzen, um besseren Code langsamer zu schreiben. Der Kern des Ansatzes: Mehrere Agenten auf ein PR-Review ansetzen, um Bugs nach Schweregrad zu finden, und diese dann systematisch beheben.
So funktioniert es
Lawson beschreibt eine Claude-Fähigkeit, die aus der Kernidee eines anderen Artikels abgeleitet ist: Je mehr verschiedene Modelle man auf ein PR-Review ansetzt, desto weniger Halluzinationen oder unechte Bugs erhält man. Die Fähigkeit nutzt drei Agenten – Claude-Sub-Agent, Codex und Cursor Bugbot – um Bugs in einem PR zu finden, eingeteilt in kritisch/hoch/mittel/niedrig. Nach Abschluss überprüfst du ihre Ergebnisse, schließt Falsch-Positive aus und erstellst einen Abschlussbericht.
Definiere „Bug“ nach deinen eigenen Vorstellungen: Lawsons Definition umfasst KISS/DRY-Prinzipien, barrierefreies HTML/JSX, korrekte SQL-Indizes usw. Er behauptet, die Falsch-Positiv-Rate liege nahe Null, und die Fähigkeit finde immer massenhaft Bugs – von kritischen Sicherheitslücken bis zu irreführenden Kommentaren.
Typischer Workflow
- Lass einen Agenten alle kritischen und hohen Bugs beheben (mit deiner Anleitung zur richtigen Lösung), dann wiederhole den Vorgang, bis keine mehr übrig sind.
- Überspringe hohe/mittlere Bugs, bei denen der Aufwand zur Behebung (z. B. 100 Zeilen für einen engen Randfall) sich nicht lohnt.
- Verwerfe den PR, wenn er so viele kritische Fehler enthält, dass der gesamte Ansatz verfehlt ist.
Der Review-Prozess deckt oft bereits bestehende Bugs auf, was zu tangentialen Nebenaufgaben führt, wie dem Schreiben von Komponententests und dem Beheben subtiler Fehler. Dies ist das Gegenteil von 10x-Produktivitäts-Slop-Cannon-Entwicklung, verbessert aber die allgemeine Codebasis-Gesundheit und vertieft das Verständnis von Fehlermodi.
Wenn du skeptisch gegenüber KI-Coding bist, wird dich das nicht überzeugen. Aber wenn du hunderte Zeilen lange PRs ausspuckst, die du kaum verstehst, lädt Lawson dich ein, langsamer zu machen: Frage einen Agenten, wie dein PR funktioniert und wo er scheitern könnte, lass ihn Markdown-Dokumentation mit Mermaid-Diagrammen schreiben oder nutze Matt Pococks /grill-me-Fähigkeit, bis du den gesamten PR von vorne bis hinten verstehst.
Verwandte Diskussionen auf Hacker News: HN-Thread (748 Punkte, 288 Kommentare).
📖 Lies die vollständige Quelle: HN AI Agents
👀 Siehe auch

So richten Sie Qwen 3.6 Plus Preview auf OpenRouter für die kostenlose Nutzung von OpenClaw ein
Qwen 3.6 Plus Preview ist derzeit kostenlos auf OpenRouter mit einem Kontextfenster von 1 Million Token verfügbar und eignet sich für KI-Agentenarbeit. Die Einrichtung umfasst die Erstellung eines OpenRouter-Kontos, das Hinzufügen des Anbieters zu OpenClaw und die Konfiguration des Modells.

Fix Remote Browser Automation mit OpenClaw Node Setup
Verwenden Sie einen lokalen OpenClaw-Knoten, um CDP/RDP-Kopfschmerzen zu vermeiden – führen Sie den Browser sichtbar aus, behalten Sie Ihre IP und Cookies.

Zwei Telegram-Bots in einer Gruppe verbinden: Zustellungssemantik über HTTP
Ein Entwickler teilt einen praktischen Ansatz, um zwei unabhängige Telegram-Bots im selben Gruppenchat zu verbinden. Dabei werden die Lücken bei der Bot-zu-Bot-Zustellung von Telegram mit HTTP-Relays, ACKs, Deduplizierung und streng begrenzten Feeds überbrückt.

Wie kleine Modellbewertungs-Prompts in die Irre führen können und wie man sie korrigiert
Ein Reddit-Beitrag erklärt, dass Evaluierungsaufforderungen für kleine Modelle oft irreführende Ergebnisse liefern, weil sie die falschen kognitiven Pfade in Transformern aktivieren. Dabei werden drei verschiedene Modi identifiziert: Faktenabruf, Anwendung/Befolgung von Anweisungen und emotionale/empathische Schlussfolgerung.