Torrix: Observabilidade de LLM Auto-Hospedada Sem Postgres ou Redis

Torrix é uma ferramenta de observabilidade para LLMs auto-hospedada, projetada para equipes que desejam ver o que seus agentes estão fazendo em produção sem a sobrecarga de Postgres, Redis ou infraestrutura complexa. Ela roda como um único contêiner Docker com SQLite. A instalação completa é:
curl -o docker-compose.yml https://raw.githubusercontent.com/torrix-ai/install/main/docker-compose.community.yml
docker compose upSem dependências externas. Todos os dados ficam em um arquivo SQLite local na sua máquina. Após a inicialização, abra http://localhost:8088 e crie uma conta.
Principais Funcionalidades
- Registro de chamadas de LLM via proxy HTTP ou SDK Python/Node.js: tokens, custo, latência, rastreamento completo de prompts e respostas, captura de tokens de raciocínio.
- Suporte a provedores: OpenAI, Anthropic, Gemini, Groq, Mistral, Azure OpenAI e qualquer endpoint compatível com a API da OpenAI.
- Previsão de custos e limites de orçamento rígidos
- Mascaramento de PII
- Regras de roteamento de modelos
- Avaliações com execuções de ouro e juiz de IA
- Biblioteca de prompts com histórico de versões
- Tags de execução para filtragem por ambiente
- Servidor MCP para que Assistentes de IA possam consultar seus próprios logs
- Ingestão OTLP/HTTP para aplicativos que já usam OpenTelemetry
Exemplo de Uso do SDK (Python)
pip install torrix
import torrix
from openai import OpenAI
torrix.init(api_key="<sua-chave-torrix-api>", base_url="http://localhost:8088")
client = torrix.wrap(OpenAI(api_key="<sua-chave-openai>"))
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "Olá!"}],
torrix_name="minha-execucao",
)
print(response.choices[0].message.content)
O SDK Node.js também está disponível via npm install.
Licenciamento e Escalabilidade
A edição comunitária é gratuita para um usuário com retenção de 7 dias. A versão Pro adiciona equipes, RBAC, retenção de 30 dias, gerenciamento de chaves de API, pesquisa em texto completo e logs de auditoria. SQLite não escala para alta taxa de gravação; esta ferramenta é direcionada para equipes que registram centenas a alguns milhares de chamadas de LLM por dia, não milhões.
📖 Leia a fonte completa: HN LLM Tools
👀 See Also

Integração OpenClaw para Mercados de Ações Indianos: Terminal de Análise e Negociação Multi-Agente
Um terminal de negociação de código aberto para mercados indianos foi configurado como um servidor de habilidades OpenClaw, permitindo que qualquer agente OpenClaw obtenha dados do mercado de ações indiano e execute análises completas via HTTP sem instalação local. O sistema utiliza sete agentes especialistas trabalhando em paralelo para gerar análises estruturadas com planos de negociação.

Simplificando a Automação com os Wrappers OpenClaw
Os Wrappers do OpenClaw oferecem uma maneira eficiente de gerenciar agentes de codificação de IA. Descubra como essas ferramentas se integram facilmente a estruturas existentes com exemplos específicos de comandos e feedback da comunidade.

Pipeline de Tradução de Livros Locais Utiliza Qwen 32B e Mistral 24B com RAG Contextual
Um desenvolvedor criou um pipeline de tradução de livros totalmente local e automatizado que converte arquivos PDF para o formato ePub usando oito scripts Python. O sistema aborda problemas comuns de tradução, como perda de contexto e problemas de formatação, por meio de um fluxo de trabalho em várias etapas.

Plugin Claude Code para Pesquisa de Negócios no Reddit
Um plugin do Claude Code automatiza a pesquisa no Reddit para empresas, buscando postagens relevantes, analisando discussões e gerando relatórios estruturados em markdown com descobertas e links de origem. Sem necessidade de chaves de API — instale via GitHub e execute com um único comando.