Claude Opus 4.6 effort=low parameter provoca un comportamiento de agente perezoso.

El parámetro effort de Claude Opus 4.6 se comporta de manera diferente a configuraciones similares de otros proveedores de IA, lo que provoca un comportamiento inesperado de los agentes cuando se establece en low.
Hallazgos Clave
Las pruebas revelaron que con effort=low, Claude Opus 4.6 mostró un comportamiento significativamente más perezoso de lo esperado:
- Realizó menos llamadas a herramientas
- Fue menos exhaustivo en la verificación cruzada
- Ignoró efectivamente partes de las instrucciones del sistema que indicaban cómo realizar investigaciones web
- Devuelvió respuestas incorrectas con confianza porque dejó de buscar información
La fuente señala que cambiar a effort=medium solucionó todos estos problemas. Según la documentación, el parámetro effort de Anthropic controla el esfuerzo conductual general, no solo la profundidad del razonamiento como reasoning.effort=low de OpenAI o thinking_level=low de Gemini.
Distinción Importante
Esto no es un error, sino una diferencia documentada en la implementación. El parámetro effort en Claude Opus 4.6 tiene un alcance más amplio que los parámetros equivalentes de otros proveedores. Esto significa que no se puede tratar effort como un reemplazo directo de reasoning.effort o thinking_level cuando se trabaja con diferentes proveedores de IA.
Las pruebas se realizaron con la expectativa de que effort=low se comportaría de manera similar a las configuraciones de bajo esfuerzo de otros proveedores, pero el comportamiento real fue más extremo, lo que llevó a agentes que no solo pensaban menos, sino que actuaban de manera más perezosa en general.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

llama.cpp con cuantización Q8_0 obtiene una aceleración de 3.1x en GPUs Intel Arc con la corrección de reordenamiento SYCL.
Una corrección para el backend SYCL de llama.cpp lleva la cuantización Q8_0 en GPUs Intel Arc del 21% al 66% del ancho de banda de memoria teórico, logrando 15,24 tokens/segundo frente a 4,88 tokens/segundo anteriormente en una Arc Pro B70 con Qwen3.5-27B.

Spotify lanza insignias 'verificadas' para etiquetar artistas humanos versus actos generados por IA
Spotify añade una insignia de check verde 'Verificado por Spotify' a los perfiles de artistas que cumplen criterios como vinculación a redes sociales, fechas de conciertos o merchandising, con el objetivo de distinguir a los artistas humanos de los generados por IA.

Opus 4.7 se inyecta a sí mismo y filtra el prompt del sistema
Usuarios de Claude Opus 4.7 informan que el modelo inyecta prompts falsos del sistema y filtra partes de los prompts reales sin ningún desencadenante del usuario.

OpenClaw 5.4 Agrega Comandos /steer y /side: Redirige al Agente a Mitad de Tarea Sin Perder Contexto
OpenClaw 5.4 introduce los comandos /steer y /side que permiten redirigir la dirección de la tarea actual de un agente o iniciar una conversación lateral sin perder el contexto de la sesión.