Claude schrieb 3.000 Codezeilen, anstatt pywikibot zu importieren – eine Fallstudie darüber, wie KI-Agenten bestehende Bibliotheken ignorieren

✍️ OpenClawRadar📅 Veröffentlicht: 12. Mai 2026🔗 Source
Claude schrieb 3.000 Codezeilen, anstatt pywikibot zu importieren – eine Fallstudie darüber, wie KI-Agenten bestehende Bibliotheken ignorieren
Ad

Ein Entwickler wollte mit Claude Code (Opus 4.7) Tippfehler auf Fandom-Wikis korrigieren. Anstatt vorhandene Bibliotheken per pip zu installieren, schrieb Claude ~3.000 Zeilen Python neu, die pywikibot, mwparserfromhell und den RETF-Regelsatz von Wikipedia implementierten – ohne einmal das Web nach bereits existierenden Lösungen zu durchsuchen.

Was gebaut wurde vs. was existierte

  • Wikitext-Stripper: 122 Zeilen Regex für verschachtelte Vorlagen, <nowiki>, <pre>, <ref> mit Vorlagen, Farb-Tags. Existierend: mwparserfromhell.parse(text).strip_code()
  • Tippfehler-Wörterbuch: 18 Einträge (teh→the, recieve→receive, occured→occurred, …). Existierend: RETF, ~4.000 Regeln, von der Community seit 2007 gepflegt
  • Edit-Runner: 10 Kopien, ~250 LOC pro Stück, mit Cookie-Auth, rohem CSRF-Fetch, maxlag-Backoff, Konflikt-Wiederholung. Existierend: pywikibot.Page.save() – die migrierte Version hat 8 Zeilen
  • Kosmetische Korrekturen: Eigenbau-Muster. Existierend: pywikibot/scripts/cosmetic_changes.py, seit ~2010 ausgeliefert
  • Wiki-Familienkonfiguration: 13 handgefertigte SiteDefinitions in einem families/-Verzeichnis. Existierend: pywikibot/families/*.py, wird upstream mitgeliefert

Der Entwickler verbrachte den Tag damit, triviale Fehler im selbstgebauten Stripper zu debuggen – ASCII-Art, die in Matches eindrang, Codeblöcke, die tokenisiert wurden. Jeder Fehler wurde mit einem weiteren Regex-Fall geflickt.

Ad

Migration zu Bibliotheken

Eine zweiminütige Google-Suche lieferte Links zu allen drei Bibliotheken. Nach der Migration fiel lib/ von ~3.000 auf 1.259 Zeilen. Der Stripper wurde zu einem Wrapper um mwparserfromhell, zehn Edit-Runner schrumpften zu einem Wrapper um pywikibot, und RETF-Regeln werden nun zur Laufzeit abgerufen.

Bemerkenswerterweise argumentierte Claude, das Tippfehler-Wörterbuch zu behalten – alle 18 Einträge waren bereits in RETF enthalten, einige schlechter formuliert. Das Modell verhandelte, Arbeit zu bewahren, die von der gerade importierten Bibliothek strikt dominiert wurde.

Warum dies passiert

  1. Benchmarks bestrafen das richtige Verhalten: Öffentliche Programmier-Benchmarks laufen abgeschottet – kein Netzwerk, kein pip install, keine Websuche. Durch RL auf diese Evaluierungen lernen Modelle, nicht auf Bibliotheken zurückzugreifen.
  2. Sunk-Cost-Verteidigung: Sobald 3.000 Zeilen im Kontext existieren, behandelt das Modell sie als tragend. Das Wörterbuch überlebte nicht, weil es nützlich war, sondern weil es da war.

Der Autor bemerkt dasselbe Muster auch anderswo – Claude schreibt benutzerdefiniertes SVG, anstatt eine Diagrammbibliothek zu verwenden, und argumentiert dann, das SVG sei „einfacher anzupassen“. Ist es nicht.

📖 Zur vollständigen Quelle: HN AI Agents

Ad

👀 Siehe auch

SWE-CI: Neuer Benchmark testet KI-Agenten auf langfristige Code-Wartung via CI
Werkzeuge

SWE-CI: Neuer Benchmark testet KI-Agenten auf langfristige Code-Wartung via CI

SWE-CI ist ein Repository-Level-Benchmark, der KI-gestützte Agenten bei der Wartung von Codebasen über Continuous-Integration-Zyklen hinweg bewertet. Dabei verlagert er den Fokus von statischer Fehlerbehebung auf langfristige Wartbarkeit über 100 realitätsnahe Aufgaben hinweg.

OpenClawRadar
CodeLedger: Open-Source-Claude-Code-Plugin verfolgt Token-Verbrauch und Hintergrund-Agenten
Werkzeuge

CodeLedger: Open-Source-Claude-Code-Plugin verfolgt Token-Verbrauch und Hintergrund-Agenten

CodeLedger ist ein Open-Source-MCP-Server-Plugin für Claude Code, das automatisch die Token-Nutzung über Projekte hinweg verfolgt, Hintergrund-Agenten identifiziert und auf Basis der Analyse lokaler JSONL-Sitzungsdateien Empfehlungen zur Kostenoptimierung liefert.

OpenClawRadar
Agent Times Skill für ClawHub fügt Echtzeit-Nachrichten, Wetter- und Token-Preisabfragen hinzu
Werkzeuge

Agent Times Skill für ClawHub fügt Echtzeit-Nachrichten, Wetter- und Token-Preisabfragen hinzu

Eine neue ClawHub-Fähigkeit namens Agent Times ermöglicht es KI-Agenten, Echtzeit-Anfragen zu Nachrichten, Wetter und Kryptowährungspreisen zu beantworten. Die Installation erfolgt über npx clawhub install agenttimes, und sie bietet Zugriff auf über 228.000 Artikel aus 3.576 Feeds mit Stimmungsbewertung und Entitätsextraktion.

OpenClawRadar
Hybride Suche mit RRF verbessert KI-Gedächtnissystem im Vergleich zu reiner Vektorsuche
Werkzeuge

Hybride Suche mit RRF verbessert KI-Gedächtnissystem im Vergleich zu reiner Vektorsuche

Ein Open-Source-AI-Gedächtnissystem mit PostgreSQL und pgvector stellte fest, dass reine Vektorsuche für exakte Übereinstimmungen unzureichend ist, fügte daher Volltextsuche hinzu und fusionierte Ergebnisse mittels Reciprocal Rank Fusion (RRF) mit k=60 sowie Abfrageanreicherung via Tokenizer.

OpenClawRadar