Â Señal Oculta de LLM: +58% en Llamadas a Herramientas

Mientras depuraba fallos del agente ReAct con Qwen3, un desarrollador descubrió que los estados ocultos justo antes de las llamadas a herramientas son linealmente separables de los estados sin herramientas con AUC > 0.94. Esta dirección en el espacio latente, llamada Â (por "agencia"), existe en todos los tamaños de modelo desde 1.7B hasta 8B y predice llamadas a herramientas usando solo una sonda lineal.

Cómo usar la señal de agencia

Durante la inferencia, proyecta cada estado oculto en Â. Si la proyección supera un umbral θ, el modelo quiere llamar a una herramienta incluso si no lo expresa textualmente. Luego puedes forzar una llamada a herramienta.

# En tiempo de inferencia (pseudocódigo)
hidden_state = get_middle_layer_state(model, input_text)
proj = np.dot(hidden_state, Â)
if proj > threshold:
    # El modelo quiere actuar → forzar llamada a herramienta
    tool = choose_tool() # puede aprenderse o ser heurístico
    result = execute_tool(tool)
else:
    # Generación normal
    output = model.generate(input_text)

Resultados de rendimiento

Probado en 40 tareas diversas (búsqueda, código, archivos, comunicación, datos) con modelos Qwen3:

Qwen3-1.7B: 26.7% → 85% (+58% de mejora)
Qwen3-8B: 52.5% → 76.3% (+23% de mejora)

El modo de fallo "sin herramientas" bajó del 43% al 2.6%. Los modelos más pequeños se benefician más porque su decodificación textual es más débil, pero la señal geométrica es igualmente fuerte.

Cómo extraer Â

Tres métodos:

Opción 1: Desde tus propios rastros - Calcula la diferencia media normalizada entre estados ocultos con herramienta y sin herramienta
Opción 2: Mediante prompts contrastivos - Ejecuta 15 pares de prompts (uno que requiere una herramienta, otro pasivo) a través de tu modelo y toma la diferencia media en la capa media
Opción 3: Usa direcciones precalculadas - Usa las direcciones Â extraídas para modelos Qwen3 compartidas en el repositorio

Implementación empaquetada

El descubrimiento se ha empaquetado en una biblioteca para fácil reutilización:

bash
pip install a-hat-optimizer

python
from a_hat_optimizer import AHat

# Extracción automática desde cualquier modelo HF en 1 línea
ahat = AHat.from_model("Qwen/Qwen3-8B")

# O cargar preextraída
ahat = AHat.from_file("my_ahat_dir/")

# Usar en tu agente
should_call, confidence = ahat.predict(hidden_state)
if should_call:
    print(f"Forzar llamada a herramienta (confianza: {confidence:.2f})")

La biblioteca maneja extracción automática mediante prompts contrastivos, 4 estrategias de calibración (punto medio, F1, Youden, percentil), predicción por lotes, y guardar/cargar con metadatos incluyendo AUC e información de capas.

📖 Read the full source: r/LocalLLaMA

Aprovechando la Señal de Agencia Oculta (Â) de los LLM para Mejorar la Llamada de Herramientas

Cómo usar la señal de agencia

Resultados de rendimiento

Cómo extraer Â

Implementación empaquetada

👀 Ver también

AgentSwarms: Parque de juegos práctico y gratuito para aprender IA agéntica

idea-reality-mcp: El servidor MCP verifica la existencia de herramientas antes de que Claude escriba código

Marco de Indicación Visual Reemplaza Indicaciones de Texto con una Sola Imagen para Claude AI

Spectral: Captura Tráfico de Aplicaciones para Generar Servidores MCP para Agentes OpenClaw