Zot: Ein Leichtgewichtiger Terminal-Coding-Agent unterstützt jetzt Claude Opus 4.8

Zot ist ein minimaler Terminal-Coding-Agent, der als einzelnes statisches Go-Binary verteilt wird – keine Laufzeit, kein Docker, kein Plugin-System mit einem dedizierten Paketmanager. Nur die Agenten-Schleife. Legen Sie es in Ihren $PATH und los geht's. Es unterstützt jetzt Claude Opus 4.8 (gelistet unter Anthropic als Anbieter) neben Dutzenden anderer Modelle.
Anbieterkatalog
Zot liefert einen breiten Anbieterkatalog mit einheitlichen IDs über interaktives /login, /model, --provider und --list-models. Abonnementfähige Anbieter umfassen Anthropic (Claude Pro/Max), OpenAI Codex / ChatGPT Plus/Pro, Kimi Code und GitHub Copilot. Direkte API-Anbieter sind Anthropic, OpenAI (Chat Completions & Responses), DeepSeek, Google Gemini, Kimi/Moonshot, Groq, Cerebras, xAI, Together AI, Hugging Face Router, OpenRouter, Mistral, Z.AI, Xiaomi, MiniMax, Fireworks, Vercel AI Gateway und OpenCode. Cloud/Plattform-Anbieter: Amazon Bedrock, Google Vertex AI, Azure OpenAI, Cloudflare Workers AI und Cloudflare AI Gateway. Lokale/kompatible Anbieter: Ollama und jeder OpenAI-kompatible Endpunkt über --base-url.
Vier Ausführungsmodi
- Interaktiv — Vollständige TUI mit Streaming-Ausgabe, Schrägstrichen, Nachrichtenwarteschlange und integriertem Seitenchat.
- Print —
zot -p <prompt>für einmaligen Assistententext auf der Standardausgabe. Ideal für Shell-Pipelines. - Json —
zot --json <prompt>gibt NDJSON-Ereignisse auf der Standardausgabe aus. Perfekt für Skripte und CI. - RPC —
zot rpcläuft als langlebiger Kindprozess mit NDJSON-Befehlen auf der Standardeingabe und Ereignissen auf der Standardausgabe. In Anwendungen jeder Sprache einbindbar.
Integrierte Werkzeuge
read— Textdateien lesen, PNG/JPG/GIF/WebP inline auf modernen Terminals rendern.write— Dateien erstellen oder überschreiben, erforderliche Elternverzeichnisse werden angelegt.edit— Ein oder mehrere exakte Ersetzungen in einer vorhandenen Datei.bash— Shell-Befehl mit zusammengeführter Standardausgabe/Fehlerausgabe und Timeout ausführen. Mit/jailkönnen alle Werkzeuge auf das aktuelle Verzeichnis beschränkt werden. Bash verweigertsudo,rm -rf /und andere Ausbruchsmuster als Schutz.
Erweiterungen
Erweiterungen können in jeder Sprache über einen Unterprozess plus JSON-RPC-Protokoll geschrieben werden. Sie registrieren Schrägstrichbefehle, stellen neue Werkzeuge bereit, fangen Werkzeugaufrufe für Berechtigungsabfragen ab und öffnen interaktive Panels in der TUI. Installation mit zot ext install ./my-extension, Auflistung mit zot ext list, Logs verfolgen mit zot ext logs my-extension -f. Updates aktualisieren auch per Git installierte Erweiterungen.
Modell-Entdeckung
--list-models und /model zeigen zusammengeführte Kataloge aller Anbieter, einschließlich integrierter Einträge und Live-IDs, die über GET /v1/models mit gespeicherten API-Schlüsseln entdeckt wurden (zwischengespeichert in $ZOT_HOME/models-cache.json für sechs Stunden). Benutzerdefinierte Modelle können über $ZOT_HOME/models.json hinzugefügt werden, wobei Benutzereinträge Vorrang haben.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

Mehrfach-Anbieter-LLM-Fallback-Kette mit Ollama-Unterstützung in der produktiven KI-IDE
Resonant Genesis AI IDE integriert lokale LLM-Unterstützung als erstklassigen Anbieter neben Groq, OpenAI, Anthropic und Gemini über 30+ Microservices hinweg, wobei eine gemeinsame UnifiedLLMClient-Bibliothek mit automatischer Fallback-Kette verwendet wird.

Effizientes Token-Management mit Open-Source-MCP-Servern: Pare
Pare MCP-Server reduzieren Token-Abfälle und verbessern die Effizienz, wenn KI-Coding-Agenten Entwicklertools nutzen, indem sie strukturierte Ausgaben bereitstellen.

Creation OS: Ein lokaler σ-gesteuerter LLM-Laufzeit, der Modelle sagen lässt „Ich weiß es nicht“ statt zu halluzinieren
Creation OS umhüllt lokale LLMs (BitNet, Qwen, Gemma, beliebige GGUF) mit einem σ-Gate, das mehrere Unsicherheitskanäle misst und pro Ausgabe ACCEPT, RETHINK oder ABSTAIN entscheidet. Keine Cloud, keine API. Die Genauigkeit bei TruthfulQA verbesserte sich durch selektive Regeneration um ~29%.

Die Optimierung von ANE durch telefonisch gesteuerte KI-Experimente zeigt Vorteile der Kernel-Fusion.
Ein Entwickler führte 55 Experimente zur Optimierung des Apple Neural Engine durch und steuerte den Prozess von seinem Telefon aus, wobei er Claude für Brainstorming nutzte. Wichtige Verbesserungen umfassten die Verschmelzung von 3 ANE-Kerneln zu einem Mega-Kernel, wodurch der Validierungsverlust von 3,75 auf 2,49 und die Schrittzeit von 176 ms auf 96 ms reduziert wurden.