Claude Opus 4.6 effort=low parameter provoca un comportamiento de agente perezoso.

✍️ OpenClawRadar📅 Publicado: 12 de marzo de 2026🔗 Source

El parámetro effort de Claude Opus 4.6 se comporta de manera diferente a configuraciones similares de otros proveedores de IA, lo que provoca un comportamiento inesperado de los agentes cuando se establece en low.

Hallazgos Clave

Las pruebas revelaron que con effort=low, Claude Opus 4.6 mostró un comportamiento significativamente más perezoso de lo esperado:

Realizó menos llamadas a herramientas
Fue menos exhaustivo en la verificación cruzada
Ignoró efectivamente partes de las instrucciones del sistema que indicaban cómo realizar investigaciones web
Devuelvió respuestas incorrectas con confianza porque dejó de buscar información

La fuente señala que cambiar a effort=medium solucionó todos estos problemas. Según la documentación, el parámetro effort de Anthropic controla el esfuerzo conductual general, no solo la profundidad del razonamiento como reasoning.effort=low de OpenAI o thinking_level=low de Gemini.

Distinción Importante

Esto no es un error, sino una diferencia documentada en la implementación. El parámetro effort en Claude Opus 4.6 tiene un alcance más amplio que los parámetros equivalentes de otros proveedores. Esto significa que no se puede tratar effort como un reemplazo directo de reasoning.effort o thinking_level cuando se trabaja con diferentes proveedores de IA.

Las pruebas se realizaron con la expectativa de que effort=low se comportaría de manera similar a las configuraciones de bajo esfuerzo de otros proveedores, pero el comportamiento real fue más extremo, lo que llevó a agentes que no solo pensaban menos, sino que actuaban de manera más perezosa en general.

📖 Leer la fuente completa: r/LocalLLaMA

👀 Ver también

Noticias

Qwen 3.6 27B Evaluado en DeepSWE: 2% de Puntuación, 70 Horas, 44k de Tokens Promedio de Salida

Qwen 3.6 27B (FP8, caché KV BF16, contexto 262k) obtuvo un 2 % en DeepSWE en 70 horas. Los tokens de salida promediaron 44k por tarea, comparable a modelos más grandes como Qwen 3.6 Plus. Se ejecutó en 1x RTX6000 Pro Blackwell a través de RunPod.

22 jun 2026, 00:18 UTC

OpenClawRadar

Noticias

Críticos de arte IA no logran identificar pintura real de Monet, revelando crítica hueca

Un usuario publicó una pintura real de Monet como generada por IA, y los críticos escribieron análisis detallados de sus "defectos", destacando la brecha entre la crítica segura y la comprensión real del arte de IA vs. humano.

16 may 2026, 10:15 UTC

OpenClawRadar

Noticias

GLM-5.1 Lanzado con Rendimiento de Codificación Igualando a Claude Opus 4.5

El modelo GLM-5.1 de Zhipu AI ya está disponible para todos los usuarios del Plan de Codificación, logrando 77.8 puntos en SWE-bench-Verified y 56.2 puntos en Terminal Bench 2.0. El modelo cuenta con una ventana de contexto de 200K, una salida máxima de 128K y 744B parámetros con 40B activados.

27 mar 2026, 18:45 UTC

OpenClawRadar

Noticias

Pruebas de Mercados de Agentes de IA: Resultados Prácticos de ClawGig, RentAHuman y Configuraciones Basadas en OpenClaw

Un desarrollador probó varios mercados de agentes de IA, encontrando que ClawGig tenía agentes que no respondían y puntuaciones de reputación manipuladas, los agentes de RentAHuman no podían mantener conversaciones coherentes, mientras que las configuraciones independientes basadas en OpenClaw mostraron potencial pero carecían de visibilidad.

15 mar 2026, 04:45 UTC

OpenClawRadar