Komponenten eines Coding Agents: Wie Tools, Speicher und Kontext LLMs erweitern

Sebastian Raschka skizziert die Architektur von Coding-Agenten, Systeme, die LLMs in Anwendungsschichten einbetten, um die Leistung bei Programmieraufgaben zu verbessern. Er unterscheidet zwischen LLMs, Reasoning-Modellen und Agenten und erklärt, dass ein Großteil des praktischen Fortschritts in LLM-Systemen von den umgebenden Systemkomponenten und nicht nur von besseren Modellen stammt.
Schlüsselkomponenten von Coding-Agenten
Der Artikel identifiziert sechs Hauptbausteine, die Coding-Agenten effektiv machen:
- Repo-Kontext: Navigation und Verwaltung von Code-Repository-Informationen
- Tool-Design: Integration externer Tools und Funktionen
- Prompt-Cache-Stabilität: Konsistente Prompt-Verwaltung über Sitzungen hinweg
- Speicher: Zustandserhaltung und Sitzungskontinuität
- Langzeit-Sitzungskontinuität: Kontexterhaltung über längere Interaktionen
- Modellauswahl: Auswahl eines geeigneten LLM oder Reasoning-Modells
Architekturschichten
Raschka definiert mehrere Schlüsselkonzepte im Agenten-Ökosystem:
- LLM: Das zentrale Next-Token-Modell
- Reasoning-Modell: Ein LLM, das darauf trainiert oder gepromptet ist, mehr Inferenzzeit für Zwischenüberlegungen, Verifizierung oder Suche nach Antwortkandidaten aufzuwenden
- Agent: Eine Kontrollschleife um das Modell, die entscheidet, was als nächstes inspiziert wird, welche Tools aufgerufen werden, wie der Zustand aktualisiert wird und wann gestoppt wird
- Agent-Harness: Das Softwaregerüst um einen Agenten, das Kontext, Tool-Nutzung, Prompts, Zustand und Kontrollfluss verwaltet
- Coding-Harness: Ein Spezialfall des Agent-Harness speziell für Softwareentwicklung, der Code-Kontext, Tools, Ausführung und iteratives Feedback verwaltet
Er merkt an, dass Claude Code und Codex CLI als Coding-Harnesse betrachtet werden können. Die Beziehung wird beschrieben als: Das LLM ist der Motor, ein Reasoning-Modell ist ein aufgerüsteter Motor, und ein Agent-Harness hilft uns, das Modell effektiv zu nutzen.
Programmierarbeit umfasst mehr als nur Next-Token-Generierung – sie erfordert Repository-Navigation, Suche, Funktionsnachschlagen, Diff-Anwendung, Testausführung, Fehlerinspektion und Kontextverwaltung. Coding-Harnesse kombinieren drei Schichten: die Modellfamilie, eine Agentenschleife und Laufzeitunterstützung.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Ein Einzelentwickler-Zweiphasen-Prompting-Verfahren für große Projekte mit Claude AI
Ein Einzelentwickler teilt einen Workflow, bei dem Claude Chat als Architekt und Claude Code als Builder fungiert, mit einer zweiphasigen Prompt-Methode, die Fehlermodusanalyse und Verifizierungsschleusen beinhaltet.

Einen MCP-Server zur Selbstinstallation bringen: Drei Hosts, drei Mechanismen, Stolperfallen
Ein tiefer Einblick in die programmatische Installation von MCP-Servern in VS Code, Cursor und Claude Code – inklusive APIs, Dateioperationen und Randfälle wie fehlerhaftes JSON, atomare Schreibvorgänge und idempotente Updates.

"OpenClaw 101 meistern: Ein Anfängerleitfaden inspiriert von Redditor-Einsichten"
Tauchen Sie mit unserem umfassenden Leitfaden in OpenClaw ein, inspiriert von Erkenntnissen aus der Reddit-Community. Vermeiden Sie häufige Fallen und maximieren Sie Ihre Produktivität mit diesen Expertentipps.

Beheben von Claude Cowork-Fehlern "Fehler beim Starten des Arbeitsbereichs" unter Windows 11 Home
Ein Benutzer hat Startfehler von Claude Cowork unter Windows 11 Home gelöst, indem er das Windows Subsystem für Linux (WSL2) aus dem Microsoft Store installiert hat, was für die zugrundeliegende VM-Technologie erforderlich ist.