Erstellung von CLIs für KI-Agenten: Designprinzipien von Googles gws CLI

Warum Agenten-zuerst-CLI-Design wichtig ist
Die Entwicklererfahrung (DX) für Menschen optimiert für Entdeckbarkeit und Verzeihlichkeit, während die Agenten-DX Vorhersagbarkeit und Verteidigung in der Tiefe erfordert. Der Artikel argumentiert, dass die Nachrüstung von Menschen-zuerst-CLIs für Agenten ineffektiv ist, und demonstriert dies anhand der gws CLI von Google für Google Workspace, die von Anfang an mit KI-Agenten als primären Nutzern entworfen wurde.
Wichtige Designprinzipien
Rohe JSON-Nutzlasten statt maßgeschneiderter Flags: Menschen bevorzugen einfache Flags wie --title "My Doc", aber Agenten arbeiten besser mit direkten JSON-Nutzlasten, die sich ohne Übersetzungsverlust auf API-Schemata abbilden.
Beispielvergleich:
Menschen-zuerst (10 Flags, flacher Namensraum): my-cli spreadsheet create --title "Q1 Budget" --locale "en_US" --timezone "America/Denver" --sheet-title "January" --sheet-type GRID --frozen-rows 1 --frozen-cols 2 --row-count 100 --col-count 10 --hidden falseAgenten-zuerst (ein JSON-Flag): gws sheets spreadsheets create --json ' { "properties": {"title": "Q1 Budget", "locale": "en_US", "timeZone": "America/Denver"}, "sheets": [{"properties": {"title": "January", "sheetType": "GRID", "gridProperties": {"frozenRowCount": 1, "frozenColumnCount": 2, "rowCount": 100, "columnCount": 10}, "hidden": false}}] }'
Die gws CLI verwendet --params und --json Flags für alle Eingaben und akzeptiert vollständige API-Nutzlasten direkt. Der empfohlene Ansatz ist, beide Pfade in derselben Binärdatei zu unterstützen, anstatt separate Tools zu pflegen.
Zusätzliche Überlegungen
Der Artikel skizziert mehrere weitere Designüberlegungen für Agenten-zuerst-CLIs:
- Schema-Introspektion: Selbstbeschreibende Schemata, die Agenten zur Laufzeit introspektieren können
- Kontextfenster-Disziplin: Verwaltung der Ausgabe, um innerhalb der Agenten-Kontextgrenzen zu passen
- Eingabe-Härtung: Schutz vor Agenten-Halluzinationen
- Agenten-Fähigkeiten: Bereitstellung von Fähigkeiten anstatt nur Befehlen
- Multi-Oberflächen-Unterstützung: Zusammenarbeit mit MCP, Erweiterungen und Umgebungsvariablen
- Sicherheitsbarrieren: Trockenlauf-Modi und Antwortbereinigung
CLIs werden zur reibungslosesten Schnittstelle für KI-Agenten, um mit externen Systemen zu interagieren, und erfordern deterministische, maschinenlesbare Ausgaben anstatt menschenorientierter Oberflächen.
📖 Read the full source: HN AI Agents
👀 Siehe auch

ProofShot CLI verleiht KI-Codierungsagenten Browser-Verifizierungsfunktionen
ProofShot ist ein Open-Source-CLI-Tool, das KI-Coding-Agents ermöglicht, UI-Funktionen zu überprüfen, indem es Browser-Sitzungen aufzeichnet, Screenshots erfasst und Konsolenfehler sammelt. Es funktioniert mit jedem Agenten, der Shell-Befehle ausführen kann, und erstellt eigenständige HTML-Berichte zur menschlichen Überprüfung.

Benutzererfahrung: Wechsel von OpenClaw zu Hermes Agent auf lokalem LLM
Ein Entwickler berichtet, dass er von OpenClaw zu Hermes Agent gewechselt hat und dabei Qwen3.5-9B auf einer RX 9070 XT mit 16 GB VRAM verwendet. Hermes erledigte eine komplexe Aufgabe mit 5 korrekten Tool-Aufrufen im Vergleich zu über 50 Schritten bei OpenClaw, war dabei 2:30 Minuten schneller und behielt gleichzeitig RAG, Tool-Aufrufe und persistente Speicherfunktionalität bei.

9 kostenlose Claude-Code-Fähigkeiten für medizinische Forschungsabläufe
Ein Radiologieforscher hat 9 Claude Code Skills als Open-Source veröffentlicht, die den medizinischen Forschungsablauf von der Literatursuche bis zur Manuskripterstellung abdecken. Die Skills umfassen PubMed-Suche mit Anti-Halluzinations-Verifizierung, Generierung von Statistikanalyse-Code und Erstellung von publikationsreifen Abbildungen.

idea-reality-mcp: MCP-Server prüft vorhandene Tools, bevor Claude Code schreibt
Ein Entwickler hat einen MCP-Server namens idea-reality-mcp erstellt, der GitHub-Repositories, Hacker News-Diskussionen, npm-Pakete und PyPI durchsucht, bevor Claude Code schreibt, und einen 'Realitätssignal'-Score von 0-100 zurückgibt, der den Marktwettbewerb anzeigt.