LLMock: Servidor de simulação baseado em HTTP para testes determinísticos de LLM entre processos

✍️ OpenClawRadar📅 Publicado: March 14, 2026🔗 Source
LLMock: Servidor de simulação baseado em HTTP para testes determinísticos de LLM entre processos
Ad

LLMock é um servidor de simulação que intercepta chamadas de API de LLM executando-se como um servidor HTTP real em uma porta especificada, permitindo testes determinísticos em múltiplos processos sem acessar APIs pagas.

Ad

Detalhes Principais

A ferramenta foi descoberta após um desenvolvedor gastar US$ 12 executando testes Playwright contra APIs reais da OpenAI. O problema ocorreu ao usar MSW (Mock Service Worker), que modifica o módulo HTTP dentro do processo Node.js que chama server.listen(), mas deixa processos separados (como um agente Python) completamente cegos à simulação.

Com LLMock, você aponta a variável de ambiente OPENAI_BASE_URL para o servidor de simulação de cada processo, independentemente de ser Node.js, Python ou qualquer outra linguagem:

const mock = new LLMock({ port: 5555 });
await mock.start();
process.env.OPENAI_BASE_URL = "http://localhost:5555/v1";

Fixtures são arquivos JSON simples que correspondem a substrings de mensagens do usuário ou padrões regex, eliminando código repetitivo de manipuladores:

{
  "fixtures": [
    {
      "match": { "userMessage": "preço da ação da AAPL" },
      "response": { "content": "O preço atual da ação da Apple Inc. (AAPL) é US$ 150,25." }
    }
  ]
}

Principais recursos da fonte:

  • Fala o formato SSE real da OpenAI/Claude/Gemini corretamente (errar tipos de eventos quebra o streaming de maneiras sutis)
  • Suporte completo a chamadas de ferramentas - frameworks de agente as executam normalmente
  • Roteamento por predicados para inspecionar estado de prompt do sistema ou histórico de mensagens para fluxos multiagente
  • Registro de solicitações para verificar o que foi realmente chamado, não apenas se o teste passou
  • Zero dependências

O desenvolvedor terminou com 9 chamadas LLM em 3 testes Playwright, custando US$ 0 e produzindo resultados determinísticos a cada execução.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Plugin Claude Code Analisa Desperdício e Anomalias de Tokens Localmente
Tools

Plugin Claude Code Analisa Desperdício e Anomalias de Tokens Localmente

Um desenvolvedor criou um plugin Claude Code chamado claude-token-analyzer que diagnostica desperdício de tokens em sessões do Claude Code analisando dados locais. A ferramenta analisou 8.392 sessões e encontrou 1.015 anomalias, sendo ExcessiveToolUse a mais comum.

OpenClawRadar
Lightpanda: Navegador headless de código aberto para agentes de LLM com servidor MCP nativo e saída em markdown
Tools

Lightpanda: Navegador headless de código aberto para agentes de LLM com servidor MCP nativo e saída em markdown

Lightpanda é um navegador headless de código aberto projetado para agentes alimentados por LLM que usa 16x menos memória que o Chrome (215MB vs 2GB) e completa benchmarks de web crawling em 5 segundos em vez de 47 segundos. Ele fornece saída nativa em markdown, árvore semântica com detecção de interatividade e um servidor MCP integrado.

OpenClawRadar
Problemas de Compromisso: Uma Ferramenta que Analisa e 'Enterra' Repositórios Inacabados do GitHub
Tools

Problemas de Compromisso: Uma Ferramenta que Analisa e 'Enterra' Repositórios Inacabados do GitHub

Um desenvolvedor criou uma ferramenta chamada Commitment Issues que analisa repositórios do GitHub para determinar se foram abandonados, gera um 'certificado de óbito' e extrai a mensagem do último commit como 'últimas palavras'. A ferramenta usa heurísticas como frequência de commits, última atividade e estrelas versus momentum, e foi prototipada usando Claude.

OpenClawRadar
AgentBnB: Rede P2P para Agentes OpenClaw Alugarem Habilidades
Tools

AgentBnB: Rede P2P para Agentes OpenClaw Alugarem Habilidades

AgentBnB é uma rede peer-to-peer onde agentes OpenClaw podem alugar habilidades especializadas de outros agentes usando créditos, em vez de gastar tokens em tarefas para as quais não são otimizados. O sistema lida com descoberta, execução e pagamento automaticamente, sem intervenção humana.

OpenClawRadar