Opus 4.7 puede seguir ~500 instrucciones, frente a ~150 hace un año

✍️ OpenClawRadar📅 Publicado: 13 de mayo de 2026🔗 Source
Ad

Investigaciones de julio de 2025 encontraron que los LLM podían seguir ~150 instrucciones antes de fallar en adherirse a las adicionales. Una actualización de mayo de 2026 muestra que Opus 4.7 ahora sigue de manera confiable ~500 instrucciones, mientras que GPT-5.5 maneja ~5000. Los hallazgos sugieren que los desarrolladores pueden incluir más directivas en archivos CLAUDE.md sin causar abandono de instrucciones.

Cifras clave

  • Julio de 2025: ~150 instrucciones ejecutables de manera confiable por los mejores modelos.
  • Mayo de 2026: Opus 4.7 sigue de manera confiable ~500 instrucciones, GPT-5.5 ~5000.

Esta mejora no es lineal: es aproximadamente un orden de magnitud a lo largo del año. El impacto práctico: archivos CLAUDE.md más largos y detallados ahora son factibles, con menor riesgo de que el modelo ignore reglas posteriores.

Ad

Qué cambió

La investigación original de julio de 2025 limitaba las instrucciones utilizables a ~150. Los nuevos datos (mayo de 2026) indican que Opus 4.7 puede manejar ~500 sin degradación. La capacidad de ~5000 de GPT-5.5 sugiere que incluso estructuras de indicaciones más grandes pueden mantenerse.

Para los desarrolladores que utilizan agentes de codificación de IA, esto significa que pueden expandir sus archivos de instrucciones: incluir más casos extremos, preferencias de estilo o restricciones específicas del proyecto, sin que el modelo pierda el hilo.

📖 Lee la fuente completa: r/ClaudeAI

Ad

👀 Ver también

Preocupaciones sobre la Visibilidad de Costos de la API de Claude para Desarrolladores Independientes
Noticias

Preocupaciones sobre la Visibilidad de Costos de la API de Claude para Desarrolladores Independientes

Una discusión en Reddit destaca que la falta de seguimiento granular de costos en la API de Claude Sonnet puede llevar a que desarrolladores independientes la abandonen a pesar de su calidad, con facturas de $400–$900 que los toman por sorpresa debido a una observabilidad insuficiente en comparación con el monitoreo estilo AWS.

OpenClawRadar
Vista Previa de Investigación de Claude Agrega Control Directo de Computadora para Automatización de Tareas
Noticias

Vista Previa de Investigación de Claude Agrega Control Directo de Computadora para Automatización de Tareas

Anthropic ha lanzado una vista previa de investigación donde Claude puede controlar directamente tu computadora para completar tareas como abrir aplicaciones, navegar en navegadores y llenar hojas de cálculo. Disponible para usuarios Pro y Max en macOS, funciona a través de Claude Cowork y Claude Code con emparejamiento móvil requerido.

OpenClawRadar
Discusión de OpenClaw sobre Mensajería entre Agentes de IA y Compartición de Contexto
Noticias

Discusión de OpenClaw sobre Mensajería entre Agentes de IA y Compartición de Contexto

Un debate en Reddit explora las implicaciones de que los agentes de IA utilicen contexto personal para comunicarse con otros agentes en nombre del usuario, examinando qué información los usuarios podrían estar dispuestos a compartir.

OpenClawRadar
Nemotron 3 4B rinde menos que Qwen 3.5 4B en puntos de referencia exigentes.
Noticias

Nemotron 3 4B rinde menos que Qwen 3.5 4B en puntos de referencia exigentes.

Un usuario de Reddit probó Nemotron 3 4B Q8 contra Qwen 3.5 4B Q8 en tareas complejas de matemáticas y programación, encontrando que Nemotron no logró producir razonamientos correctos y salidas estructuradas, mientras que Qwen pasó todas las pruebas.

OpenClawRadar