Warum KI-Coding-Agenten nach 20 Schritten Mist produzieren: Kontextblindheit

Ein Entwickler auf r/LocalLLaMA hat seine API-Logs und Prompt-Payloads geprüft, nachdem er bemerkt hatte, dass die Token-Nutzung anstieg und die Agentenausgabe nach etwa 20 Iterationen nachließ. Seine Schlussfolgerung: Die Modelle werden nicht dümmer; sie ersticken an ihren eigenen überladenen Kontextfenstern.
Die vier strukturellen Fehler
Nachdem er untersucht hatte, was Cursor und Claude Code in einem Repository mit über 10.000 Zeilen tatsächlich tun, identifizierte der Autor vier Muster:
- Blinde Erkundung: Der Agent durchsucht rekursiv mit grep und legt etwa 40 verschiedene Dateien in den Kontext, nur um eine einzige Hilfsfunktion zu finden. Oft übersieht er eine vorhandene Komponente und halluziniert ein Duplikat von Grund auf.
- Rohe Aufnahme: Eine 2.000-zeilige Datei wird in den Prompt geladen, um ein 5-zeiliges Interface zu aktualisieren. Verschwendet massiv Kontext-Token.
- Tool-Durchfall: Ausführliche Testlogs und riesige MCP-Tool-Definitionen verbrauchen rund 30k Token, bevor das Modell ein einziges Code-Token generiert.
- Goldfisch-Gedächtnis: Jede Sitzung beginnt von vorn – kein Projektbewusstsein – so dass dieselben Dateien immer wieder neu gelesen werden.
Kipppunkt bei 80% Kontext
Sobald der Kontext zu etwa 80% mit Rauschen gefüllt ist, verschlechtert sich der Aufmerksamkeitsmechanismus des Modells drastisch. Der IQ sinkt sichtbar auf Zimmertemperatur, und es beginnt, die Architektur zu zerstören. Standard-Chunking-RAG behebt dies nicht, da es für Logik ungeeignet ist – der Agent bleibt blind für die Codebasis-Struktur, bis er Token für das Lesen von Rohtext verbrennt.
Vorgeschlagene Lösung: AST oder Graph-DB
Der Autor fordert einen Open-Source-Agenten, der Code in einen AST oder eine Graphdatenbank parst, bevor er Kontext verbraucht, damit er die Struktur versteht, ohne Token für Rohtext zu verschwenden. Dies würde architektonische Spaghetti verhindern, die pro eingesparter Stunde Tipparbeit 5 Stunden Korrektur kosten.
Für wen das gedacht ist
Entwickler, die Cursor, Claude Code oder lokale LLM-Agenten für reale Codebasen verwenden und von Produktivitätsparadoxien frustriert sind.
📖 Lies die vollständige Quelle: r/LocalLLaMA
👀 Siehe auch

Claudebin: Exportieren und Teilen Ihrer Claude-Code-Sitzungen
Claudebin ermöglicht es Ihnen, gesamte Claude-Code-Sitzungen zu exportieren, wodurch sie über eine einzige URL teilbar und fortsetzbar werden.

Verwendung des MCP-Code-Modus für effiziente Claude-Schlüsselwortrecherche
Ein Entwickler baute einen MCP-Server, der Claude ermöglicht, autonome Keyword-Recherche mithilfe eines Code-Modus-Musters durchzuführen, wodurch die Tool-Definitions-Tokens von Tausenden auf etwa 1.000 mit nur zwei Tools reduziert wurden: Suche und Ausführung.

Claude Code Best Practice GitHub-Repository erreicht 5.000 Sterne
Ein GitHub-Repository namens 'claude-code-best-practice' hat 5.000 Sterne erreicht. Das Repository wurde mit Claude erstellt, um Best Practices, Tipps und Arbeitsabläufe sowohl vom Ersteller als auch von der Community zu dokumentieren.

Reseed CLI: Extrahiere Designsysteme aus beliebigen Websites für Claude Code und Cursor
Reseed ist ein CLI-Tool, das Design-Tokens (Farben, Abstände, Schriftgrößen, Radien) aus jeder Website extrahiert und eine tailwind.config.ts, design-system.md sowie eine Referenz-HTML für Claude Code und Cursor generiert.