Torrix: LLM-Beobachtbarkeit selbst gehostet ohne Postgres oder Redis

Torrix ist ein selbst gehostetes LLM-Beobachtungstool, das für Teams entwickelt wurde, die sehen möchten, was ihre Agenten in der Produktion tun – ohne den Overhead von Postgres, Redis oder komplexer Infrastruktur. Es läuft als einzelner Docker-Container mit SQLite-Backend. Die vollständige Installation erfolgt mit:
curl -o docker-compose.yml https://raw.githubusercontent.com/torrix-ai/install/main/docker-compose.community.yml
docker compose upKeine externen Abhängigkeiten. Alle Daten bleiben in einer lokalen SQLite-Datei auf Ihrem Rechner. Nach dem Start öffnen Sie http://localhost:8088 und erstellen ein Konto.
Hauptfunktionen
- LLM-Aufrufprotokollierung via HTTP-Proxy oder Python/Node.js SDK: Token, Kosten, Latenz, vollständige Prompt- und Antwort-Traces, Erfassung von Reasoning-Token.
- Provider-Unterstützung: OpenAI, Anthropic, Gemini, Groq, Mistral, Azure OpenAI und jeder OpenAI-API-kompatible Endpunkt.
- Kostenprognose und harte Budgetgrenzen
- PII-Maskierung
- Modell-Routing-Regeln
- Evals mit goldenen Runs und KI-Judge
- Prompt-Bibliothek mit Versionsverlauf
- Run-Tags zur Filterung nach Umgebung
- MCP-Server, damit KI-Assistenten Ihre eigenen Logs abfragen können
- OTLP/HTTP-Aufnahme für Apps, die bereits OpenTelemetry verwenden
SDK-Nutzungsbeispiel (Python)
pip install torrix
import torrix
from openai import OpenAI
torrix.init(api_key="<your-torrix-api-key>", base_url="http://localhost:8088")
client = torrix.wrap(OpenAI(api_key="<your-openai-key>"))
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "Hallo!"}],
torrix_name="my-run",
)
print(response.choices[0].message.content)
Das Node.js SDK ist ebenfalls über npm install verfügbar.
Lizenzierung und Skalierung
Die Community-Edition ist kostenlos für einen Benutzer mit 7-tägiger Aufbewahrungsfrist. Pro fügt Teams, RBAC, 30-tägige Aufbewahrung, API-Key-Verwaltung, Volltextsuche und Audit-Logs hinzu. SQLite skaliert nicht auf hohe Schreibdurchsätze; dies richtet sich an Teams, die täglich einige hundert bis wenige tausend LLM-Aufrufe protokollieren, nicht Millionen.
📖 Vollständigen Artikel lesen: HN LLM Tools
👀 Siehe auch

idea-reality-mcp: MCP-Server prüft vorhandene Tools, bevor Claude Code schreibt
Ein Entwickler hat einen MCP-Server namens idea-reality-mcp erstellt, der GitHub-Repositories, Hacker News-Diskussionen, npm-Pakete und PyPI durchsucht, bevor Claude Code schreibt, und einen 'Realitätssignal'-Score von 0-100 zurückgibt, der den Marktwettbewerb anzeigt.

Übersetze zu de: Reframe-Slash-Befehl für Claude Code wendet kognitionswissenschaftliche Technik zur Problemlösung an
Ein Entwickler hat einen /reframe-Slash-Befehl für Claude Code erstellt, der eine kognitionswissenschaftliche Technik namens Distanz-Engagement-Oszillation implementiert. Der Ansatz wurde mit 50 Problemen über drei Open-Weight-LLMs getestet und übertraf durchgängig andere Methoden.

MCP-Server: Vergleich von lokalen und Cloud-LLMs mit Debattierfunktion
Der MCP-Server ermöglicht Entwicklern, lokale Modelle über Ollama neben verschiedenen Cloud-LLMs abzufragen, und bietet Funktionen wie einen Vergleich nebeneinander und eine strukturierte Debattenfunktion.

Warum deterministische Workflows die KI-gesteuerte Orchestrierung für Agentensysteme übertreffen
Ein Entwickler mit einem Jahr Erfahrung im Aufbau von Agentensystemen teilt mit, dass KI-gesteuerte Orchestrierung aufgrund nicht-deterministischer Routing-Entscheidungen, sich aufschaukelnder Fehler, explodierender Kosten und unmöglicher Fehlersuche nicht zuverlässig funktionierte. Der Wechsel zu deterministischen Workflows mit codebasierter Orchestrierung beseitigte die Orchestrierungsfehler.