Torrix: LLM-Beobachtbarkeit selbst gehostet ohne Postgres oder Redis

✍️ OpenClawRadar📅 Veröffentlicht: 13. Mai 2026🔗 Source
Torrix: LLM-Beobachtbarkeit selbst gehostet ohne Postgres oder Redis
Ad

Torrix ist ein selbst gehostetes LLM-Beobachtungstool, das für Teams entwickelt wurde, die sehen möchten, was ihre Agenten in der Produktion tun – ohne den Overhead von Postgres, Redis oder komplexer Infrastruktur. Es läuft als einzelner Docker-Container mit SQLite-Backend. Die vollständige Installation erfolgt mit:

curl -o docker-compose.yml https://raw.githubusercontent.com/torrix-ai/install/main/docker-compose.community.yml
docker compose up

Keine externen Abhängigkeiten. Alle Daten bleiben in einer lokalen SQLite-Datei auf Ihrem Rechner. Nach dem Start öffnen Sie http://localhost:8088 und erstellen ein Konto.

Hauptfunktionen

  • LLM-Aufrufprotokollierung via HTTP-Proxy oder Python/Node.js SDK: Token, Kosten, Latenz, vollständige Prompt- und Antwort-Traces, Erfassung von Reasoning-Token.
  • Provider-Unterstützung: OpenAI, Anthropic, Gemini, Groq, Mistral, Azure OpenAI und jeder OpenAI-API-kompatible Endpunkt.
  • Kostenprognose und harte Budgetgrenzen
  • PII-Maskierung
  • Modell-Routing-Regeln
  • Evals mit goldenen Runs und KI-Judge
  • Prompt-Bibliothek mit Versionsverlauf
  • Run-Tags zur Filterung nach Umgebung
  • MCP-Server, damit KI-Assistenten Ihre eigenen Logs abfragen können
  • OTLP/HTTP-Aufnahme für Apps, die bereits OpenTelemetry verwenden
Ad

SDK-Nutzungsbeispiel (Python)

pip install torrix

import torrix from openai import OpenAI

torrix.init(api_key="<your-torrix-api-key>", base_url="http://localhost:8088") client = torrix.wrap(OpenAI(api_key="<your-openai-key>"))

response = client.chat.completions.create( model="gpt-4o-mini", messages=[{"role": "user", "content": "Hallo!"}], torrix_name="my-run", ) print(response.choices[0].message.content)

Das Node.js SDK ist ebenfalls über npm install verfügbar.

Lizenzierung und Skalierung

Die Community-Edition ist kostenlos für einen Benutzer mit 7-tägiger Aufbewahrungsfrist. Pro fügt Teams, RBAC, 30-tägige Aufbewahrung, API-Key-Verwaltung, Volltextsuche und Audit-Logs hinzu. SQLite skaliert nicht auf hohe Schreibdurchsätze; dies richtet sich an Teams, die täglich einige hundert bis wenige tausend LLM-Aufrufe protokollieren, nicht Millionen.

📖 Vollständigen Artikel lesen: HN LLM Tools

Ad

👀 Siehe auch

idea-reality-mcp: MCP-Server prüft vorhandene Tools, bevor Claude Code schreibt
Werkzeuge

idea-reality-mcp: MCP-Server prüft vorhandene Tools, bevor Claude Code schreibt

Ein Entwickler hat einen MCP-Server namens idea-reality-mcp erstellt, der GitHub-Repositories, Hacker News-Diskussionen, npm-Pakete und PyPI durchsucht, bevor Claude Code schreibt, und einen 'Realitätssignal'-Score von 0-100 zurückgibt, der den Marktwettbewerb anzeigt.

OpenClawRadar
Übersetze zu de: Reframe-Slash-Befehl für Claude Code wendet kognitionswissenschaftliche Technik zur Problemlösung an
Werkzeuge

Übersetze zu de: Reframe-Slash-Befehl für Claude Code wendet kognitionswissenschaftliche Technik zur Problemlösung an

Ein Entwickler hat einen /reframe-Slash-Befehl für Claude Code erstellt, der eine kognitionswissenschaftliche Technik namens Distanz-Engagement-Oszillation implementiert. Der Ansatz wurde mit 50 Problemen über drei Open-Weight-LLMs getestet und übertraf durchgängig andere Methoden.

OpenClawRadar
MCP-Server: Vergleich von lokalen und Cloud-LLMs mit Debattierfunktion
Werkzeuge

MCP-Server: Vergleich von lokalen und Cloud-LLMs mit Debattierfunktion

Der MCP-Server ermöglicht Entwicklern, lokale Modelle über Ollama neben verschiedenen Cloud-LLMs abzufragen, und bietet Funktionen wie einen Vergleich nebeneinander und eine strukturierte Debattenfunktion.

OpenClawRadar
Warum deterministische Workflows die KI-gesteuerte Orchestrierung für Agentensysteme übertreffen
Werkzeuge

Warum deterministische Workflows die KI-gesteuerte Orchestrierung für Agentensysteme übertreffen

Ein Entwickler mit einem Jahr Erfahrung im Aufbau von Agentensystemen teilt mit, dass KI-gesteuerte Orchestrierung aufgrund nicht-deterministischer Routing-Entscheidungen, sich aufschaukelnder Fehler, explodierender Kosten und unmöglicher Fehlersuche nicht zuverlässig funktionierte. Der Wechsel zu deterministischen Workflows mit codebasierter Orchestrierung beseitigte die Orchestrierungsfehler.

OpenClawRadar