GoModel: Ein leichtgewichtiges Open-Source-AI-Gateway, geschrieben in Go

GoModel ist ein in Go geschriebenes Open-Source-AI-Gateway, das zwischen Ihrer Anwendung und Modellanbietern wie OpenAI, Anthropic, Gemini und anderen sitzt. Es bietet eine einheitliche OpenAI-kompatible API-Schnittstelle, während es anbieterspezifische Unterschiede intern verarbeitet.
Wichtige Funktionen und Unterschiede
Das Projekt wurde entwickelt, um mehrere praktische Probleme zu lösen: Nachverfolgung der KI-Nutzung und Kosten pro Kunde oder Team, Wechsel von Modellen ohne Änderung des Anwendungscodes, einfachere Fehlersuche im Anfragefluss und Reduzierung der KI-Ausgaben durch exakte und semantische Zwischenspeicherung.
Wesentliche Unterscheidungsmerkmale zu Alternativen:
- ~17 MB großes Docker-Image (LiteLLMs Image ist ~746 MB auf amd64, wodurch GoModel 44-mal leichter ist)
- Anfrage-Workflow ist sichtbar und leicht zu überprüfen
- Konfiguration ist standardmäßig umgebungsvariablenbasiert
Schnellstart
Grundlegende Bereitstellung mit Docker:
docker run --rm -p 8080:8080 \
-e OPENAI_API_KEY="your-openai-key" \
enterpilot/gomodel
Für den Produktionseinsatz sollten Sie Geheimnisse nicht über die Befehlszeile übergeben und stattdessen verwenden:
docker run --env-file .env enterpilot/gomodel
Stellen Sie Ihren ersten API-Aufruf:
curl http://localhost:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "gpt-5-chat-latest", "messages": [{"role": "user", "content": "Hello!"}] }'
Unterstützte Anbieter
GoModel unterstützt mehrere LLM-Anbieter mit automatischer Erkennung basierend auf den bereitgestellten Zugangsdaten:
- OpenAI (OPENAI_API_KEY)
- Anthropic (ANTHROPIC_API_KEY)
- Google Gemini (GEMINI_API_KEY)
- Groq (GROQ_API_KEY)
- OpenRouter (OPENROUTER_API_KEY)
- Z.ai (ZAI_API_KEY)
- xAI/Grok (XAI_API_KEY)
- Azure OpenAI (AZURE_API_KEY + AZURE_BASE_URL)
- Oracle (ORACLE_API_KEY + ORACLE_BASE_URL)
- Ollama (OLLAMA_BASE_URL)
Das Gateway unterstützt Chat-Vervollständigungen, Einbettungen, Dateiverarbeitung, Batch-Operationen und Durchleitungsfunktionen bei den meisten Anbietern. Für Oracle müssen Sie möglicherweise ORACLE_MODELS=openai.gpt-oss-120b,xai.grok-3 setzen, wenn der Upstream-/models-Endpunkt nicht verfügbar ist.
Alternative Einrichtungsmethoden
Sie können es auch aus dem Quellcode ausführen (Go 1.26.2+ erforderlich) oder Docker Compose für Infrastrukturkomponenten wie Redis, PostgreSQL, MongoDB und Adminer verwenden.
Diese Art von Gateway ist besonders nützlich für Teams, die mehrere KI-Modelle über verschiedene Anbieter hinweg verwalten, Kostenverfolgung benötigen oder die Flexibilität bewahren möchten, Anbieter ohne Codeänderungen zu wechseln. Das schlanke Docker-Image macht es für ressourcenbeschränkte Umgebungen geeignet.
📖 Read the full source: HN LLM Tools
👀 Siehe auch

Session Inspector für Claude Code bietet Echtzeit-Einblicke in die Abläufe von KI-Agenten.
Vibeyard, eine Open-Source-Terminal-IDE, die Claude Code einbindet, hat eine Session Inspector-Funktion hinzugefügt, die Echtzeit-Einblicke in Claude Code-Sitzungen mit Zeitachsenverfolgung, Kostenaufschlüsselung, Tool-Analysen und Kontextfensterüberwachung bietet.

OpenClaw Kubernetes Operator mit integrierter Ollama-Unterstützung
Ein Community-Mitglied hat einen OpenClaw Kubernetes-Operator erstellt, der eingebettete Ollama-Unterstützung enthält und es KI-Agenten ermöglicht, mit lokalen Modellen im selben Namespace zu laufen. Das Setup umfasst Installationsbefehle, Konfigurationsdetails für lokale und Cloud-Ollama-Modelle sowie Anweisungen für den Dashboard-Zugriff.

Bin ich OpenAI-kompatibel: Tool & Dokumentation für einheitliche API-Signaturen
Ein neues Tool und eine Dokumentationsseite dokumentieren die OpenAI-Kompatibilität von Open-Source-KI-Engines wie vLLM und llama.cpp, einschließlich offizieller und inoffizieller Signaturen.

Benchmark-Ergebnisse: GitHub CLI vs. MCP-Ansätze für KI-Agenten
Ein unabhängiger Benchmark verglich GitHub CLI, MCP, MCP mit Tool Search und MCP mit Code Mode für KI-Agenten-Aufgaben. GitHub CLI war die kosteneffizienteste Lösung, während MCP-Ansätze Kompromisse bei Kosten, Latenz und Fehlermodi zeigten.