Ausnutzen des verborgenen Agentursignals (Â) von LLMs für besseres Tool Calling

Während der Fehlersuche bei ReAct-Agenten mit Qwen3 entdeckte ein Entwickler, dass verborgene Zustände direkt vor Werkzeugaufrufen linear von Zuständen ohne Werkzeugaufruf mit einem AUC > 0,94 trennbar sind. Diese Richtung im latenten Raum, genannt  (für "Agency"), existiert über Modellgrößen von 1,7B bis 8B und sagt Werkzeugaufrufe allein mit einer linearen Sonde voraus.
Wie man das Agency-Signal nutzt
Während der Inferenz wird jeder verborgene Zustand auf  projiziert. Überschreitet die Projektion einen Schwellenwert θ, möchte das Modell ein Werkzeug aufrufen, selbst wenn es dies nicht textuell ausdrückt. Anschließend kann ein Werkzeugaufruf erzwungen werden.
# Zur Inferenzzeit (Pseudo-Code)
hidden_state = get_middle_layer_state(model, input_text)
proj = np.dot(hidden_state, Â)
if proj > threshold:
# Modell möchte handeln → Werkzeugaufruf erzwingen
tool = choose_tool() # kann gelernt oder heuristisch sein
result = execute_tool(tool)
else:
# Normale Generierung
output = model.generate(input_text)
Leistungsergebnisse
Getestet an 40 vielfältigen Aufgaben (Suche, Code, Datei, Kommunikation, Daten) mit Qwen3-Modellen:
- Qwen3-1.7B: 26,7 % → 85 % (+58 % Gewinn)
- Qwen3-8B: 52,5 % → 76,3 % (+23 % Gewinn)
Der "Kein-Werkzeug"-Fehlermodus sank von 43 % auf 2,6 %. Kleinere Modelle profitieren stärker, weil ihre textuelle Dekodierung schwächer ist, aber das geometrische Signal gleichermaßen stark ist.
Wie man  extrahiert
Drei Methoden:
- Option 1: Aus eigenen Spuren - Berechne den normalisierten Mittelwertunterschied zwischen Werkzeug- und Nicht-Werkzeug-Zuständen
- Option 2: Über kontrastive Prompts - Führe 15 Paare von Prompts (einen mit Werkzeugbedarf, einen passiven) durch dein Modell und nimm den Mittelwertunterschied in der mittleren Schicht
- Option 3: Verwende vorberechnete Richtungen - Nutze die für Qwen3-Modelle im Repository geteilten Â-Richtungen
Verpackte Implementierung
Die Entdeckung wurde in eine Bibliothek für einfache Wiederverwendung verpackt:
bash
pip install a-hat-optimizer
python
from a_hat_optimizer import AHat
# Automatische Extraktion von jedem HF-Modell in einer Zeile
ahat = AHat.from_model("Qwen/Qwen3-8B")
# Oder vorberechnete laden
ahat = AHat.from_file("my_ahat_dir/")
# In deinem Agenten verwenden
should_call, confidence = ahat.predict(hidden_state)
if should_call:
print(f"Werkzeugaufruf erzwingen (Konfidenz: {confidence:.2f})")
Die Bibliothek übernimmt automatische Extraktion über kontrastive Prompts, 4 Kalibrierungsstrategien (Mittelpunkt, F1, Youden, Perzentil), Batch-Vorhersage und Speichern/Laden mit Metadaten einschließlich AUC und Schichtinformationen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Prompt-Master: Claude-Fähigkeit zur Erzeugung präziser KI-Tool-Prompts
Prompt-Master ist eine kostenlose Claude-Fähigkeit, die präzise Prompts für verschiedene KI-Tools schreibt, darunter Cursor, Claude Code, GPT, Midjourney, Kling und Eleven Labs. Das Tool hat über 600 Sterne auf GitHub erreicht und verarbeitet mehr als 4000 Zugriffe.

Tether: Ein MCP-Server zum Austausch von Kontext zwischen KI-Modellen über SQLite
Tether ist ein Open-Source-Tool, das JSON-Daten auf 28-Byte inhaltsadressierte Handles reduziert, wodurch mehrere KI-Modelle Kontext über eine gemeinsame SQLite-Datenbank teilen können. Es fungiert als MCP-Server und ermöglicht die direkte Kommunikation zwischen Modellen wie Claude und MiniMax ohne Kopieren und Einfügen.

OpenClaw integriert Funktionen aus dem Claude-Code-Leak
Ein OpenClaw-Benutzer ließ seinen Bot den geleakten Claude-Code (Rust-Nachbau von Instructkr) analysieren und selektiv bestimmte Architekturmuster in sein OpenClaw-Setup übertragen. Die Integration konzentriert sich auf praktische Verbesserungen wie automatische Startkontinuität, Gesprächskompaktierung und ein Pre-Tool/Post-Tool-Hook-Framework.

Baton: Eine Desktop-Anwendung zur Verwaltung mehrerer KI-Codierungsagenten
Baton ist eine Desktop-Anwendung, die Entwicklern hilft, mehrere KI-Coding-Agenten über isolierte Arbeitsbereiche hinweg zu verwalten. Sie bietet echte Terminal-Sitzungen, Git-Worktree-Isolierung und Statusüberwachung für Agenten wie Claude Code, Codex CLI, OpenCode und Gemini CLI.