Vibe-Coding vs. Agentisches Engineering: Die Grenzen verschwimmen unangenehm

Simon Willison, der Schöpfer von Datasette und langjähriger Python-Entwickler, sprach kürzlich mit Joseph Ruscio im Heavybit-High-Leverage-Podcast (Folge #9) über KI-Codierungstools. In einem Folgeblogbeitrag vom 6. Mai 2026 teilt er eine beunruhigende Erkenntnis: Die Grenzen zwischen Vibe Coding und agentischem Engineering verschwimmen in seiner täglichen Arbeit.
Vibe Coding vs. agentisches Engineering: ursprüngliche Definitionen
Willison zog zuvor eine scharfe Trennlinie zwischen beiden:
- Vibe Coding: Nicht-Programmierer oder Programmierer, die den Code nicht überprüfen. Du fragst nach etwas, bekommst etwas, und wenn es kaputtgeht, drückst du die Daumen. In Ordnung für persönliche Werkzeuge, bei denen Fehler nur dir schaden – grob fahrlässig für Produktionssoftware, die von anderen genutzt wird.
- Agentisches Engineering: Professionelle Softwareentwickler, die KI nutzen, um qualitativ hochwertigere Produktionssysteme schneller zu bauen, während sie dennoch ihr Fachwissen in Sicherheit, Wartbarkeit und Betrieb anwenden. Jede Zeile wird überprüft.
Wo die Konvergenz stattfindet
Das Problem ist, dass Codierungsagenten wie Claude Code zuverlässig genug geworden sind, dass Willison nun die Codeüberprüfung für routinemäßige Produktionsaufgaben auslässt. Sein Beispiel:
Bitte Claude Code, einen JSON-API-Endpunkt zu bauen, der eine SQL-Abfrage ausführt und die Ergebnisse als JSON ausgibt.
Es wird es einfach richtig machen. Es wird das nicht vermasseln.
Du lässt es automatisierte Tests hinzufügen, du lässt es Dokumentation hinzufügen, du weißt, dass es gut sein wird.
Er gibt zu, dass er sich dabei schuldig fühlt: „Wenn ich den Code nicht überprüft habe, ist es dann wirklich verantwortungsvoll, dies in der Produktion zu verwenden?“
Das mentale Modell: einem Agenten wie einem Team vertrauen
Willison vergleicht dies mit der Arbeit in einer großen Organisation, in der ein anderes Team einen Bildskalierungsdienst bereitstellt. Du liest nicht jede Zeile ihres Codes – du liest die Dokumentation, testest den Dienst und behandelst ihn als eine halbe Blackbox, bis du auf Probleme stößt. Er behandelt KI-Agenten jetzt genauso.
Aber er stellt einen unangenehmen Unterschied fest: „Claude Code hat keinen professionellen Ruf! Es kann keine Verantwortung für das übernehmen, was es getan hat. Aber es hat sich trotzdem immer wieder bewährt – immer wieder spuckt es einfache Dinge aus und macht sie richtig in dem Stil, den ich mag.“
Er nennt dies eine Form der „Normalisierung von Abweichungen“ – die schrittweise Akzeptanz geringerer Kontrolle, während das Werkzeug sich immer wieder beweist.
Erkenntnisse für Entwickler, die KI-Agenten nutzen
Willisons Beitrag ist eine praktische Warnung: Je zuverlässiger Agenten werden, desto größer wird die Versuchung, die Überprüfung auszulassen. Sein Ratschlag ist nicht, Agenten nicht mehr zu nutzen, sondern sich bewusst zu bleiben, wo man Abstriche macht. Für Produktionssysteme, die andere betreffen, braucht es immer noch einen Menschen, der den Code versteht und zur Verantwortung gezogen werden kann.
📖 Lies die vollständige Quelle: HN AI Agents
👀 Siehe auch

Spannungen eskalieren zwischen dem Pentagon und dem KI-Unternehmen Anthropic.
Die Nutzung von Anthropics KI durch das Pentagon in geheimen Operationen, wie einem Einsatz in Venezuela, hat Spannungen über die Sicherheitsrichtlinien des Unternehmens verursacht.

Schiff-Rounds LIFT AI Act: Was Entwickler über den KI-Bildungsgesetzentwurf für K-12 wissen müssen
OpenAI, Google und Microsoft unterstützen den LIFT AI Act, der NSF-Zuschüsse für KI-Literacy-Curricula in K-12, Lehrertraining und Bewertungswerkzeuge bereitstellt.

Claude Code CC 2.1.124 und 2.1.126: Erinnerung an überschrittenes Dateiänderungsbudget, Aktualisierung der Harness-Anweisungen, REPL wartet auf Klärung, und Erinnerung an Malware-Analyse entfernt
CC 2.1.124 fügt eine Systemerinnerung für aufgrund von Budgetgrenzen ausgelassene Dateiänderungen hinzu, aktualisiert die Harness-Anweisungen mit expliziten Einfügepunkten und stellt das REPL-Auto-Await-Verhalten klar. CC 2.1.126 entfernt die Erinnerung zur Malware-Analyse nach dem Lesen.

Beweis der Modellidentität mit der Modellverpackungstechnologie von Tinfoil
Tinfoils Modelwrap sorgt dafür, dass Inferenzanbieter die genauen Modellgewichte bereitstellen, die sie behaupten, und verwendet dabei kryptografische Verpflichtungen, die von sicheren Enklaven überprüft werden.