LLMock: Servidor de simulação baseado em HTTP para testes determinísticos de LLM entre processos

LLMock é um servidor de simulação que intercepta chamadas de API de LLM executando-se como um servidor HTTP real em uma porta especificada, permitindo testes determinísticos em múltiplos processos sem acessar APIs pagas.
Detalhes Principais
A ferramenta foi descoberta após um desenvolvedor gastar US$ 12 executando testes Playwright contra APIs reais da OpenAI. O problema ocorreu ao usar MSW (Mock Service Worker), que modifica o módulo HTTP dentro do processo Node.js que chama server.listen(), mas deixa processos separados (como um agente Python) completamente cegos à simulação.
Com LLMock, você aponta a variável de ambiente OPENAI_BASE_URL para o servidor de simulação de cada processo, independentemente de ser Node.js, Python ou qualquer outra linguagem:
const mock = new LLMock({ port: 5555 });
await mock.start();
process.env.OPENAI_BASE_URL = "http://localhost:5555/v1";Fixtures são arquivos JSON simples que correspondem a substrings de mensagens do usuário ou padrões regex, eliminando código repetitivo de manipuladores:
{
"fixtures": [
{
"match": { "userMessage": "preço da ação da AAPL" },
"response": { "content": "O preço atual da ação da Apple Inc. (AAPL) é US$ 150,25." }
}
]
}Principais recursos da fonte:
- Fala o formato SSE real da OpenAI/Claude/Gemini corretamente (errar tipos de eventos quebra o streaming de maneiras sutis)
- Suporte completo a chamadas de ferramentas - frameworks de agente as executam normalmente
- Roteamento por predicados para inspecionar estado de prompt do sistema ou histórico de mensagens para fluxos multiagente
- Registro de solicitações para verificar o que foi realmente chamado, não apenas se o teste passou
- Zero dependências
O desenvolvedor terminou com 9 chamadas LLM em 3 testes Playwright, custando US$ 0 e produzindo resultados determinísticos a cada execução.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Plugin Claude Code Analisa Desperdício e Anomalias de Tokens Localmente
Um desenvolvedor criou um plugin Claude Code chamado claude-token-analyzer que diagnostica desperdício de tokens em sessões do Claude Code analisando dados locais. A ferramenta analisou 8.392 sessões e encontrou 1.015 anomalias, sendo ExcessiveToolUse a mais comum.

Lightpanda: Navegador headless de código aberto para agentes de LLM com servidor MCP nativo e saída em markdown
Lightpanda é um navegador headless de código aberto projetado para agentes alimentados por LLM que usa 16x menos memória que o Chrome (215MB vs 2GB) e completa benchmarks de web crawling em 5 segundos em vez de 47 segundos. Ele fornece saída nativa em markdown, árvore semântica com detecção de interatividade e um servidor MCP integrado.

Problemas de Compromisso: Uma Ferramenta que Analisa e 'Enterra' Repositórios Inacabados do GitHub
Um desenvolvedor criou uma ferramenta chamada Commitment Issues que analisa repositórios do GitHub para determinar se foram abandonados, gera um 'certificado de óbito' e extrai a mensagem do último commit como 'últimas palavras'. A ferramenta usa heurísticas como frequência de commits, última atividade e estrelas versus momentum, e foi prototipada usando Claude.

AgentBnB: Rede P2P para Agentes OpenClaw Alugarem Habilidades
AgentBnB é uma rede peer-to-peer onde agentes OpenClaw podem alugar habilidades especializadas de outros agentes usando créditos, em vez de gastar tokens em tarefas para as quais não são otimizados. O sistema lida com descoberta, execução e pagamento automaticamente, sem intervenção humana.