3.177 API Calls: Analyse von 4 KI-Coding-Tools

Die kürzlich durchgeführte Analyse von vier KI-Coding-Tools—Claude Code Opus 4.6, Claude Code Sonnet 4.5, Codex GPT-5.3 und Gemini 2.5 Pro—hebt erhebliche Unterschiede im Umgang mit Kontextfenstern bei API-Aufrufen hervor. Mit dem Context Lens-Tracer hat die Studie 3.177 API-Aufrufe abgefangen, um die Effizienz und Strategie der Tools im Umgang mit dem Kontextfenster bei der Behebung von Fehlern in einer Express.js-Umgebung zu bewerten.

Jedes Coding-Tool beschäftigte sich mit einem spezifischen Fehler—einer falsch geordneten Nullprüfung in res.send(). Opus, Sonnet, Codex und Gemini sollten den Fehler identifizieren und beheben, gefolgt von der Ausführung der Testsuite zur Überprüfung der Behebung. Alle hatten Erfolg, jedoch mit unterschiedlichen Ansätzen und Ressourcen.

Claude Code Opus 4.6 verwendete konsequent etwa 23K bis 27K Tokens, die hauptsächlich aus Tool-Definitionen bestanden (69% des Kontextes). Dies deutet auf eine Abhängigkeit vom erneuten Senden dieser Definitionen aufgrund der Architektur hin, was zu erheblichen Caching-Überhead führte. Codex (GPT-5.3) wies eine größere Bandbreite von 29,3K bis 47,2K Tokens auf, überwiegend Tool-Ergebnisse (72%), was mehr Variabilität je nach Spezifität des Testbefehls bot. Sonnet, mit ähnlicher Variabilität, mischte Definitionen und Ergebnisse gleichmäßiger.

Gemini sticht durch seinen unverhältnismäßigen Einsatz von Tokens hervor, mit einem Höhepunkt von 350.5K, wobei nahezu ausschließlich Tool-Ergebnisse (96%) verwendet wurden, und somit sein großes Kontextfenster von 1M ausnutzt. Trotz geringerer Kosten pro Token deutet das inkonsistente und umfangreiche Nutzungsmuster von Gemini ohne Konvergenz über die Durchläufe auf eine einzigartige, wenn auch weniger effiziente Strategie hin.

Diese Ergebnisse veranschaulichen erhebliche Unterschiede im Umgang mit Kontextfenstern durch KI-Coding-Tools, was sowohl die Leistung als auch die Kosteneffizienz beeinflusst. Entwickler sollten die Token-Nutzungsstrategien abwägen, wenn sie das passende Tool für ihre Bedürfnisse auswählen, insbesondere bei Aufgaben, die iterative Änderungen oder umfangreiche Projektgeschichten betreffen.

📖 Lesen Sie die vollständige Quelle: HN LLM Tools

Analyzing AI Coding Tools: Dissecting 3,177 API Calls Analyse von KI-Coding-Tools: Zergliederung von 3.177 API-Aufrufen

👀 Siehe auch

Kanban CLI: Ein lokaler, agentenbasierter Task-Manager für das Terminal

OpenClawDreams: Eine Traumsimulator-Erweiterung für OpenClaw-Agenten

Bemerkung: Ein Markdown-Annotationstool für Claude-Code-Workflows

Graphthulhu MCP Server verleiht KI-Agenten Wissensgraphen-Gedächtnis für Logseq/Obsidian