Markdown als Protokoll für agentenbasierte Benutzeroberflächen mit Streaming-Ausführung

Ein Entwickler hat einen Prototypen erstellt, der untersucht, wie generative Benutzeroberflächen mit Codeausführung für KI-Agenten kombiniert werden können, wobei Markdown als einheitliches Protokoll dient. Das System streamt Text, ausführbaren Code und Daten in einer einzigen Antwort, wobei der Code inkrementell ausgeführt wird, sobald er eintrifft.
Das Protokoll: Markdown mit drei Blocktypen
Der Ansatz verwendet die Standard-Markdown-Syntax, die LLMs bereits verstehen, sodass keine neuen Formate erlernt werden müssen. Es werden drei Blocktypen definiert:
- Textblöcke: Einfache Markdown-Formatierung, die an den Nutzer gestreamt wird
- Code-Blöcke:
```tsx agent.runführt TypeScript/JSX-Code auf dem Server in einem persistenten Kontext aus - Datenblöcke:
```json agent.data => "id"streamt JSON-Daten in UI-Komponenten
Diese Blöcke können in beliebiger Reihenfolge innerhalb einer einzigen Antwort gemischt werden. Der Parser verarbeitet sie inkrementell, während die Tokens vom LLM eintreffen.
Streaming-Ausführung
Code wird Anweisung für Anweisung ausgeführt, während der LLM ihn generiert, ohne auf das vollständige Schließen des Code-Blocks zu warten. Dies ermöglicht es, API-Aufrufe zu starten, UI zu rendern und Fehler anzuzeigen, während der LLM noch Tokens sendet. Der Entwickler hat bun-streaming-exec erstellt, um dies zu handhaben, wobei vm.Script mit benutzerdefiniertem Wrapping verwendet wird, da Streaming-Ausführung kein Standard-Laufzeitprimitiv ist.
Agentische UI mit mount()-Primitive
Das System verwendet React für die UI-Generierung, da LLMs umfangreiche Erfahrung mit React-Komponenten und JSX haben. Das Kernprimitiv ist mount():
mount({
ui: () => <Card>Hello from the agent!</Card>
});Wenn der LLM diesen Code generiert und der Server ihn ausführt, serialisiert mount() die React-Komponente und sendet sie zur Darstellung innerhalb der Chat-Oberfläche an den Client.
Datenflussmuster
Der Prototyp implementiert vier verschiedene Muster für die Datenbewegung:
- Client → Server (Formulare): Der Agent kann auf Benutzereingaben über Formulare warten
- Server → Client (gestreamte Daten): Datenblöcke streamen JSON direkt in eingebundene UIs
- Server → LLM (console.log):
console.log-Ausgaben und Ausnahmen werden als neuer Zug an den LLM zurückgegeben - LLM → Server → Client (vollständiger Rundlauf): Vollständige Zyklen, bei denen der LLM Code generiert, der Daten abruft und UI mit diesen Daten rendert
Feedback-Schleife
Das System verwendet console.log als Mechanismus, damit der Agent mit sich selbst kommunizieren kann. Wenn der LLM Markdown mit Codeblöcken generiert, wird Text an den Nutzer gestreamt, während Code inkrementell ausgeführt wird. Alle console.*-Ausgaben oder Ausnahmen werden als neuer Zug an den LLM zurückgegeben. Wenn es keine Ausgaben oder Ausnahmen gibt, wartet das System auf eine neue Benutzeranfrage.
Dies ermöglicht es dem Agenten, auf seine eigene Ausführung zu reagieren, z. B. um Nachrichtenanzahlen zu überprüfen oder zu pausieren, um auf Benutzereingaben zu warten, bevor er fortfährt.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Ollama-Update fügt OpenClaw-Unterstützung für das Kimi k2.5-Cloud-Modell hinzu
Ollama hat ein Update veröffentlicht, das OpenClaw-Unterstützung für Cloud-Modelle integriert, einschließlich kostenfreiem Zugang zum Kimi k2.5-Modell mit Websuchfunktion, das in NVIDIA-Rechenzentren läuft.

Überarbeitung: KI-Editor entwickelt mit agentenbasierten Codierungstools und Y.js CRDT
Revise ist ein KI-Editor für Dokumente, der über 10 Monate hinweg von Grund auf mit agentenbasierten Codierungswerkzeugen entwickelt wurde. Er verfügt über eine eigene Textverarbeitungs-Engine und eine Rendering-Schicht, die nur Y.js für den CRDT-Stack verwendet. Das System integriert mehrere KI-Modelle, darunter GPT-5.4-Varianten und Claude-Modelle, für Korrekturlesen und Überarbeitungen.

ClawHost Open-Source OpenClaw Ein-Klick-Bereitstellung erreicht über 200 GitHub-Sterne
ClawHost, ein Open-Source-Tool für die Ein-Klick-Installation von OpenClaw mit vollem Serverzugriff und Kontrolle, hat über 200 GitHub-Sterne erreicht. Das Projekt behebt Probleme mit instabilen kommerziellen Wrappern, indem es eine kostenlose, selbst hostbare Lösung bietet.

BetterClaw gegen OpenClaw: Vergleich von Tool-Aufruf, strukturierten Ausgaben und Workflow-Steuerung
Ein entwicklerorientierter Vergleich von BetterClaw und OpenClaw zu den Themen Tool-Aufruf, strukturierte Ausgaben, Workflow-Steuerung und die tägliche Arbeit mit Agenten.