Claude Code schrieb 3.000 Zeilen statt pywikibot zu nutzen

Ein Entwickler wollte mit Claude Code (Opus 4.7) Tippfehler auf Fandom-Wikis korrigieren. Anstatt vorhandene Bibliotheken per pip zu installieren, schrieb Claude ~3.000 Zeilen Python neu, die pywikibot, mwparserfromhell und den RETF-Regelsatz von Wikipedia implementierten – ohne einmal das Web nach bereits existierenden Lösungen zu durchsuchen.

Was gebaut wurde vs. was existierte

Wikitext-Stripper: 122 Zeilen Regex für verschachtelte Vorlagen, <nowiki>, <pre>, <ref> mit Vorlagen, Farb-Tags. Existierend: mwparserfromhell.parse(text).strip_code()
Tippfehler-Wörterbuch: 18 Einträge (teh→the, recieve→receive, occured→occurred, …). Existierend: RETF, ~4.000 Regeln, von der Community seit 2007 gepflegt
Edit-Runner: 10 Kopien, ~250 LOC pro Stück, mit Cookie-Auth, rohem CSRF-Fetch, maxlag-Backoff, Konflikt-Wiederholung. Existierend: pywikibot.Page.save() – die migrierte Version hat 8 Zeilen
Kosmetische Korrekturen: Eigenbau-Muster. Existierend: pywikibot/scripts/cosmetic_changes.py, seit ~2010 ausgeliefert
Wiki-Familienkonfiguration: 13 handgefertigte SiteDefinitions in einem families/-Verzeichnis. Existierend: pywikibot/families/*.py, wird upstream mitgeliefert

Der Entwickler verbrachte den Tag damit, triviale Fehler im selbstgebauten Stripper zu debuggen – ASCII-Art, die in Matches eindrang, Codeblöcke, die tokenisiert wurden. Jeder Fehler wurde mit einem weiteren Regex-Fall geflickt.

Migration zu Bibliotheken

Eine zweiminütige Google-Suche lieferte Links zu allen drei Bibliotheken. Nach der Migration fiel lib/ von ~3.000 auf 1.259 Zeilen. Der Stripper wurde zu einem Wrapper um mwparserfromhell, zehn Edit-Runner schrumpften zu einem Wrapper um pywikibot, und RETF-Regeln werden nun zur Laufzeit abgerufen.

Bemerkenswerterweise argumentierte Claude, das Tippfehler-Wörterbuch zu behalten – alle 18 Einträge waren bereits in RETF enthalten, einige schlechter formuliert. Das Modell verhandelte, Arbeit zu bewahren, die von der gerade importierten Bibliothek strikt dominiert wurde.

Warum dies passiert

Benchmarks bestrafen das richtige Verhalten: Öffentliche Programmier-Benchmarks laufen abgeschottet – kein Netzwerk, kein pip install, keine Websuche. Durch RL auf diese Evaluierungen lernen Modelle, nicht auf Bibliotheken zurückzugreifen.
Sunk-Cost-Verteidigung: Sobald 3.000 Zeilen im Kontext existieren, behandelt das Modell sie als tragend. Das Wörterbuch überlebte nicht, weil es nützlich war, sondern weil es da war.

Der Autor bemerkt dasselbe Muster auch anderswo – Claude schreibt benutzerdefiniertes SVG, anstatt eine Diagrammbibliothek zu verwenden, und argumentiert dann, das SVG sei „einfacher anzupassen“. Ist es nicht.

📖 Zur vollständigen Quelle: HN AI Agents

Claude schrieb 3.000 Codezeilen, anstatt pywikibot zu importieren – eine Fallstudie darüber, wie KI-Agenten bestehende Bibliotheken ignorieren

Was gebaut wurde vs. was existierte

Migration zu Bibliotheken

Warum dies passiert

👀 Siehe auch

OpenClaw Skill Server für Indische Marktanalyse und Handel

Mnemos: Open-Sourced Local-First Memory Layer für Coding Agents

Claude Code Plugin Yoink ersetzt Bibliotheksabhängigkeiten, um Lieferkettenrisiken zu reduzieren

SkyClaw: Rust AI Agent Runtime für Cloud VPS mit Telegram-Steuerung