LLMock: HTTP-basierter Mocking-Server für deterministische LLM-Tests über Prozesse hinweg

✍️ OpenClawRadar📅 Veröffentlicht: 14. März 2026🔗 Source
LLMock: HTTP-basierter Mocking-Server für deterministische LLM-Tests über Prozesse hinweg
Ad

LLMock ist ein Mocking-Server, der LLM-API-Aufrufe abfängt, indem er als echter HTTP-Server auf einem bestimmten Port läuft, und ermöglicht so deterministisches Testen über mehrere Prozesse hinweg, ohne kostenpflichtige APIs anzusprechen.

Ad

Wichtige Details

Das Tool wurde entdeckt, nachdem ein Entwickler 12 US-Dollar für Playwright-Tests gegen echte OpenAI-APIs ausgegeben hatte. Das Problem trat auf, als MSW (Mock Service Worker) verwendet wurde, das das HTTP-Modul innerhalb des Node.js-Prozesses patcht, der server.listen() aufruft, aber separate Prozesse (wie einen Python-Agenten) völlig unberührt von der Simulation lässt.

Mit LLMock zeigen Sie die Umgebungsvariable OPENAI_BASE_URL von jedem Prozess aus auf den Mock-Server, unabhängig davon, ob es sich um Node.js, Python oder eine andere Sprache handelt:

const mock = new LLMock({ port: 5555 });
await mock.start();
process.env.OPENAI_BASE_URL = "http://localhost:5555/v1";

Fixtures sind einfache JSON-Dateien, die auf Teilzeichenketten von Benutzernachrichten oder Regex-Muster abgestimmt sind und Boilerplate-Code für Handler eliminieren:

{
  "fixtures": [
    {
      "match": { "userMessage": "stock price of AAPL" },
      "response": { "content": "The current stock price of Apple Inc. (AAPL) is $150.25." }
    }
  ]
}

Wichtige Funktionen aus der Source:

  • Spricht das tatsächliche OpenAI/Claude/Gemini SSE-Format korrekt (falsche Event-Typen brechen Streaming auf subtile Weise)
  • Vollständige Tool-Aufruf-Unterstützung – Agent-Frameworks führen sie normal aus
  • Prädikat-Routing zur Überprüfung des System-Prompt-Zustands oder Nachrichtenverlaufs für Multi-Agent-Flows
  • Request-Journal, um zu prüfen, was tatsächlich aufgerufen wurde, nicht nur ob der Test bestanden wurde
  • Keine Abhängigkeiten

Der Entwickler endete mit 9 LLM-Aufrufen über 3 Playwright-Tests hinweg, kostete 0 US-Dollar und erzielte bei jedem Durchlauf deterministische Ergebnisse.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

x402 API-Gateway für OpenClaw-Bots: Ein Endpunkt ersetzt 18 API-Schlüssel
Werkzeuge

x402 API-Gateway für OpenClaw-Bots: Ein Endpunkt ersetzt 18 API-Schlüssel

Ein x402-API-Gateway eliminiert die Notwendigkeit mehrerer API-Schlüssel in OpenClaw-Bots, indem es Zugang zu 18 Diensten bietet, darunter intelligentes LLM-Routing, Websuche, Karten, Reisen, Essen, KI- und Finanzdaten, über einen einzigen Endpunkt, der über USDC-Wallet-Guthaben authentifiziert wird.

OpenClawRadar
Hubcap Bridge: Persistente bidirektionale Kommunikation zwischen CLI und Browser-JavaScript via CDP
Werkzeuge

Hubcap Bridge: Persistente bidirektionale Kommunikation zwischen CLI und Browser-JavaScript via CDP

Hubcap Bridge ist eine neue Funktion im Hubcap-CLI-Tool, die einen persistenten bidirektionalen Nachrichtenkanal zwischen lokalen Prozessen und in Browser-Seiten laufendem JavaScript über das Chrome DevTools Protocol erstellt. Es ermöglicht Claude Code-Fähigkeiten, über interne JavaScript-APIs mit Web-Apps zu interagieren, ohne Zugang zu öffentlichen APIs zu benötigen.

OpenClawRadar
SprintiQ: Open-Source Sprint-Planung für Claude Code
Werkzeuge

SprintiQ: Open-Source Sprint-Planung für Claude Code

SprintiQ ist eine Open-Source-Agile-Plattform, die als Orchestrierungsschicht für Claude Code fungiert und KI-gestützte User-Story-Generierung, Sprintplanung, Velocity-Tracking sowie eine CLI bietet, die Git-Aktivitäten in Echtzeit mit Sprints synchronisiert.

OpenClawRadar
Microsoft BitNet: 1-Bit-LLM-Inferenz-Framework für CPU und GPU
Werkzeuge

Microsoft BitNet: 1-Bit-LLM-Inferenz-Framework für CPU und GPU

Microsoft veröffentlichte BitNet, ein Inferenz-Framework für 1-Bit-LLMs, das auf CPUs eine 1,37- bis 6,17-fache Beschleunigung erreicht und den Energieverbrauch um 55,4 % bis 82,2 % reduziert. Es kann ein 100-Milliarden-Parameter-Modell auf einer einzelnen CPU mit 5–7 Token pro Sekunde ausführen.

OpenClawRadar