Torrix: Observabilidad de LLM autoalojada sin Postgres ni Redis

✍️ OpenClawRadar📅 Publicado: 13 de mayo de 2026🔗 Source
Torrix: Observabilidad de LLM autoalojada sin Postgres ni Redis
Ad

Torrix es una herramienta de observabilidad para LLM autoalojada diseñada para equipos que quieren ver lo que sus agentes hacen en producción sin la sobrecarga de Postgres, Redis o infraestructura compleja. Se ejecuta como un solo contenedor Docker respaldado por SQLite. La instalación completa es:

curl -o docker-compose.yml https://raw.githubusercontent.com/torrix-ai/install/main/docker-compose.community.yml
docker compose up

Sin dependencias externas. Todos los datos permanecen en un archivo SQLite local en tu máquina. Tras el inicio, abre http://localhost:8088 y crea una cuenta.

Características clave

  • Registro de llamadas a LLM a través de proxy HTTP o SDK de Python/Node.js: tokens, costo, latencia, trazas completas de solicitud y respuesta, captura de tokens de razonamiento.
  • Soporte de proveedores: OpenAI, Anthropic, Gemini, Groq, Mistral, Azure OpenAI y cualquier endpoint compatible con la API de OpenAI.
  • Previsión de costos y límites presupuestarios estrictos
  • Enmascaramiento de PII
  • Reglas de enrutamiento de modelos
  • Evaluaciones con ejecuciones de referencia y juez de IA
  • Biblioteca de prompts con historial de versiones
  • Etiquetas de ejecución para filtrar por entorno
  • Servidor MCP para que los asistentes de IA consulten tus propios registros
  • Ingesta OTLP/HTTP para aplicaciones que ya usan OpenTelemetry
Ad

Ejemplo de uso del SDK (Python)

pip install torrix

import torrix from openai import OpenAI

torrix.init(api_key="<tu-clave-api-torrix>", base_url="http://localhost:8088") client = torrix.wrap(OpenAI(api_key="<tu-clave-openai>"))

response = client.chat.completions.create( model="gpt-4o-mini", messages=[{"role": "user", "content": "¡Hola!"}], torrix_name="mi-ejecucion", ) print(response.choices[0].message.content)

El SDK de Node.js también está disponible mediante npm install.

Licencia y escalado

La edición comunitaria es gratuita para un usuario con retención de 7 días. Pro añade equipos, RBAC, retención de 30 días, gestión de claves API, búsqueda de texto completo y registros de auditoría. SQLite no escala para alto rendimiento de escritura; está orientado a equipos que registran cientos o unos pocos miles de llamadas a LLM por día, no millones.

📖 Lee la fuente completa: HN LLM Tools

Ad

👀 Ver también

Recuerdo Total: Grafo de Conocimiento Local para el Historial de Conversaciones de Código de Claude
Herramientas

Recuerdo Total: Grafo de Conocimiento Local para el Historial de Conversaciones de Código de Claude

Total Recall es un sistema de código abierto que ingiere las transcripciones de conversaciones JSONL de Claude Code en una base de datos SQLite con búsqueda de texto completo e incrustaciones vectoriales, haciendo que el historial de conversaciones sea buscable entre sesiones. Recupera extractos reales de conversaciones con contexto consciente del DAG e incluye un importador de ChatGPT.

OpenClawRadar
Habilidades de Claude de Código Abierto para Gerentes de Producto: Generador de PRD, Historias de Usuario, Notas de Reuniones
Herramientas

Habilidades de Claude de Código Abierto para Gerentes de Producto: Generador de PRD, Historias de Usuario, Notas de Reuniones

Un desarrollador ha lanzado cinco habilidades gratuitas de Claude AI para gerentes de producto que generan archivos .docx formateados para PRDs, historias de usuario, síntesis de reuniones, investigación de mercado y actualizaciones para partes interesadas. Las herramientas evitan contenido alucinado y utilizan plantillas estructuradas.

OpenClawRadar
La API AskFirst añade una capa de aprobación humana para agentes de IA.
Herramientas

La API AskFirst añade una capa de aprobación humana para agentes de IA.

AskFirst es una API REST que permite a los agentes de IA pausar para obtener aprobación humana antes de realizar acciones irreversibles. Funciona con modelos locales, APIs alojadas y cualquier framework, proporcionando notificaciones por correo electrónico, opciones de aprobar/rechazar y registros de auditoría.

OpenClawRadar
La Ruta Rápida de Búsqueda de Memoria QMD de OpenClaw Tenía Errores Silenciosos
Herramientas

La Ruta Rápida de Búsqueda de Memoria QMD de OpenClaw Tenía Errores Silenciosos

La búsqueda de memoria integrada de OpenClaw utiliza coincidencia básica de palabras clave, pero los usuarios pueden cambiar a QMD para búsqueda semántica en los archivos markdown del espacio de trabajo. Una ruta rápida a través de MCPorter estaba rota con tres errores que hacían que cada llamada fallara silenciosamente y recurriera a la ejecución CLI más lenta.

OpenClawRadar