Coding Agents: Tools, Speicher & Kontext für LLMs

Sebastian Raschka skizziert die Architektur von Coding-Agenten, Systeme, die LLMs in Anwendungsschichten einbetten, um die Leistung bei Programmieraufgaben zu verbessern. Er unterscheidet zwischen LLMs, Reasoning-Modellen und Agenten und erklärt, dass ein Großteil des praktischen Fortschritts in LLM-Systemen von den umgebenden Systemkomponenten und nicht nur von besseren Modellen stammt.

Schlüsselkomponenten von Coding-Agenten

Der Artikel identifiziert sechs Hauptbausteine, die Coding-Agenten effektiv machen:

Repo-Kontext: Navigation und Verwaltung von Code-Repository-Informationen
Tool-Design: Integration externer Tools und Funktionen
Prompt-Cache-Stabilität: Konsistente Prompt-Verwaltung über Sitzungen hinweg
Speicher: Zustandserhaltung und Sitzungskontinuität
Langzeit-Sitzungskontinuität: Kontexterhaltung über längere Interaktionen
Modellauswahl: Auswahl eines geeigneten LLM oder Reasoning-Modells

Architekturschichten

Raschka definiert mehrere Schlüsselkonzepte im Agenten-Ökosystem:

LLM: Das zentrale Next-Token-Modell
Reasoning-Modell: Ein LLM, das darauf trainiert oder gepromptet ist, mehr Inferenzzeit für Zwischenüberlegungen, Verifizierung oder Suche nach Antwortkandidaten aufzuwenden
Agent: Eine Kontrollschleife um das Modell, die entscheidet, was als nächstes inspiziert wird, welche Tools aufgerufen werden, wie der Zustand aktualisiert wird und wann gestoppt wird
Agent-Harness: Das Softwaregerüst um einen Agenten, das Kontext, Tool-Nutzung, Prompts, Zustand und Kontrollfluss verwaltet
Coding-Harness: Ein Spezialfall des Agent-Harness speziell für Softwareentwicklung, der Code-Kontext, Tools, Ausführung und iteratives Feedback verwaltet

Er merkt an, dass Claude Code und Codex CLI als Coding-Harnesse betrachtet werden können. Die Beziehung wird beschrieben als: Das LLM ist der Motor, ein Reasoning-Modell ist ein aufgerüsteter Motor, und ein Agent-Harness hilft uns, das Modell effektiv zu nutzen.

Programmierarbeit umfasst mehr als nur Next-Token-Generierung – sie erfordert Repository-Navigation, Suche, Funktionsnachschlagen, Diff-Anwendung, Testausführung, Fehlerinspektion und Kontextverwaltung. Coding-Harnesse kombinieren drei Schichten: die Modellfamilie, eine Agentenschleife und Laufzeitunterstützung.

📖 Read the full source: HN AI Agents

Komponenten eines Coding Agents: Wie Tools, Speicher und Kontext LLMs erweitern

Schlüsselkomponenten von Coding-Agenten

Architekturschichten

👀 Siehe auch

Einrichten von OpenClaw auf macOS mit einem einheitlichen KI-Anbieter-Endpunkt

Automatisierung der OAuth-Token-Aktualisierung für Bots mit Claude Code

Einrichtungstipps für OpenClaw aus Nutzererfahrung: Gmail MCP, Profil-Flags und Netzwerkprobleme

Beheben von Claude Cowork-Fehlern "Fehler beim Starten des Arbeitsbereichs" unter Windows 11 Home