KI-Code: 98% mehr PRs, aber 28% Fehlererkennung bei großen PRs

Der kognitive Engpass der KI-gestützten Entwicklung

Das menschliche Gehirn verarbeitet bewusste, analytische Gedanken laut einer 2025 in Neuron veröffentlichten Studie mit etwa 10 Bits pro Sekunde. Der Arbeitsspeicher fasst ungefähr 4 Informationsbrocken gleichzeitig. Diese biologische Begrenzung erzeugt eine grundlegende Diskrepanz mit der KI-generierten Code-Ausgabe.

Die Arbeitsbelastungssteigerung quantifizieren

GitHubs Octoverse 2025 zeigt 43,2 Millionen pro Monat zusammengeführte Pull Requests, ein Anstieg von 23 % im Jahresvergleich. Die Codezeilen pro Entwickler stiegen in acht Monaten von 4.450 auf 7.839 – ein Zuwachs von 76 %. Faros AI analysierte über 10.000 Entwickler und fand heraus, dass KI-Nutzer mit KI-Unterstützung 98 % mehr Pull Requests zusammenführen.

Die SmartBear/Cisco-Studie stellte fest, dass die Fehlererkennung von 87 % bei PRs unter 100 Zeilen auf 28 % bei PRs über 1.000 Zeilen sinkt. Die Qualität bricht nach 60 Minuten Überprüfung ein. Ein OCaml-Maintainer lehnte einen 13.000 Zeilen langen KI-generierten PR aufgrund von Kapazitätsengpässen direkt ab.

Burnout und schleichende Arbeitsbelastung

Das Upwork Research Institute fand heraus, dass 77 % der KI-nutzenden Mitarbeiter sagen, sie habe ihre Arbeitsbelastung erhöht, nicht verringert. 71 % berichten von Burnout. Der besorgniserregendste Befund: eine Burnout-Rate von 88 % unter den „produktivsten“ KI-Nutzern, die doppelt so wahrscheinlich kündigen.

Forscher der UC Berkeley identifizierten drei Mechanismen der „schleichenden Arbeitsbelastung“: Aufgabenausweitung (der Umfang aller wächst, weil KI mehr möglich macht), verschwommene Grenzen (KI-Prompting geschieht während des Mittagessens, Pendelns, Abends) und impliziter Druck (wenn Kollegen sichtbar mehr mit KI schaffen, steigen die Erwartungen an alle).

Warum Expertise das Problem verschlimmert

Microsoft Research bestätigte 2024, dass KI-Systeme schwierige Aufgaben noch schwerer machen können, wobei die Nutzer dieselbe oder erhöhte kognitive Belastung haben. Der Mechanismus ist asymmetrisch: Beim Schreiben von Code externalisieren Entwickler ein bereits existierendes mentales Modell, aber beim Überprüfen von KI-generiertem Code müssen sie die Logik aus einem Artefakt rekonstruieren, das von einem System produziert wurde, das kein Verständnis des Geschäftskontexts hat.

Eine Clutch-Umfrage unter 800 Software-Experten ergab, dass 59 % der Entwickler KI-generierten Code verwenden, den sie nicht vollständig verstehen. Erfahrene Ingenieure berichten in dieser Umgebung von der geringsten Zuversicht.

📖 Read the full source: HN AI Agents

KI-generierter Code überfordert erfahrene Entwickler, wie eine Studie zeigt

Der kognitive Engpass der KI-gestützten Entwicklung

Die Arbeitsbelastungssteigerung quantifizieren

Burnout und schleichende Arbeitsbelastung

Warum Expertise das Problem verschlimmert

👀 Siehe auch

Die Notwendigkeit relationaler Governance in Multi-Agenten-KI-Systemen

Anthropics Plattformstrategie und die OpenClaw-Reaktion

Anthropics Treffen mit dem US-Verteidigungsministerium und chinesische KI-Labore destillieren Claude

Adaptive Inferenz-Routing-Vorschlag für KI-Abfrageeffizienz