LLMock: HTTP-basierter Mocking-Server für deterministische LLM-Tests über Prozesse hinweg

LLMock ist ein Mocking-Server, der LLM-API-Aufrufe abfängt, indem er als echter HTTP-Server auf einem bestimmten Port läuft, und ermöglicht so deterministisches Testen über mehrere Prozesse hinweg, ohne kostenpflichtige APIs anzusprechen.
Wichtige Details
Das Tool wurde entdeckt, nachdem ein Entwickler 12 US-Dollar für Playwright-Tests gegen echte OpenAI-APIs ausgegeben hatte. Das Problem trat auf, als MSW (Mock Service Worker) verwendet wurde, das das HTTP-Modul innerhalb des Node.js-Prozesses patcht, der server.listen() aufruft, aber separate Prozesse (wie einen Python-Agenten) völlig unberührt von der Simulation lässt.
Mit LLMock zeigen Sie die Umgebungsvariable OPENAI_BASE_URL von jedem Prozess aus auf den Mock-Server, unabhängig davon, ob es sich um Node.js, Python oder eine andere Sprache handelt:
const mock = new LLMock({ port: 5555 });
await mock.start();
process.env.OPENAI_BASE_URL = "http://localhost:5555/v1";Fixtures sind einfache JSON-Dateien, die auf Teilzeichenketten von Benutzernachrichten oder Regex-Muster abgestimmt sind und Boilerplate-Code für Handler eliminieren:
{
"fixtures": [
{
"match": { "userMessage": "stock price of AAPL" },
"response": { "content": "The current stock price of Apple Inc. (AAPL) is $150.25." }
}
]
}Wichtige Funktionen aus der Source:
- Spricht das tatsächliche OpenAI/Claude/Gemini SSE-Format korrekt (falsche Event-Typen brechen Streaming auf subtile Weise)
- Vollständige Tool-Aufruf-Unterstützung – Agent-Frameworks führen sie normal aus
- Prädikat-Routing zur Überprüfung des System-Prompt-Zustands oder Nachrichtenverlaufs für Multi-Agent-Flows
- Request-Journal, um zu prüfen, was tatsächlich aufgerufen wurde, nicht nur ob der Test bestanden wurde
- Keine Abhängigkeiten
Der Entwickler endete mit 9 LLM-Aufrufen über 3 Playwright-Tests hinweg, kostete 0 US-Dollar und erzielte bei jedem Durchlauf deterministische Ergebnisse.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

x402 API-Gateway für OpenClaw-Bots: Ein Endpunkt ersetzt 18 API-Schlüssel
Ein x402-API-Gateway eliminiert die Notwendigkeit mehrerer API-Schlüssel in OpenClaw-Bots, indem es Zugang zu 18 Diensten bietet, darunter intelligentes LLM-Routing, Websuche, Karten, Reisen, Essen, KI- und Finanzdaten, über einen einzigen Endpunkt, der über USDC-Wallet-Guthaben authentifiziert wird.

Hubcap Bridge: Persistente bidirektionale Kommunikation zwischen CLI und Browser-JavaScript via CDP
Hubcap Bridge ist eine neue Funktion im Hubcap-CLI-Tool, die einen persistenten bidirektionalen Nachrichtenkanal zwischen lokalen Prozessen und in Browser-Seiten laufendem JavaScript über das Chrome DevTools Protocol erstellt. Es ermöglicht Claude Code-Fähigkeiten, über interne JavaScript-APIs mit Web-Apps zu interagieren, ohne Zugang zu öffentlichen APIs zu benötigen.

SprintiQ: Open-Source Sprint-Planung für Claude Code
SprintiQ ist eine Open-Source-Agile-Plattform, die als Orchestrierungsschicht für Claude Code fungiert und KI-gestützte User-Story-Generierung, Sprintplanung, Velocity-Tracking sowie eine CLI bietet, die Git-Aktivitäten in Echtzeit mit Sprints synchronisiert.

Microsoft BitNet: 1-Bit-LLM-Inferenz-Framework für CPU und GPU
Microsoft veröffentlichte BitNet, ein Inferenz-Framework für 1-Bit-LLMs, das auf CPUs eine 1,37- bis 6,17-fache Beschleunigung erreicht und den Energieverbrauch um 55,4 % bis 82,2 % reduziert. Es kann ein 100-Milliarden-Parameter-Modell auf einer einzelnen CPU mit 5–7 Token pro Sekunde ausführen.