Los modelos de código abierto de menos de 100 GB no pueden superar a Claude Haiku en pruebas de programación.

Un análisis reciente de modelos de lenguaje de peso abierto revela una brecha de rendimiento significativa en comparación con Claude Haiku de Anthropic en puntos de referencia de programación. La comparación se realizó utilizando parámetros de prueba específicos y requisitos de memoria.
Metodología de evaluación
La evaluación comparó modelos en dos puntos de referencia de programación: LiveBench (enero de 2026) y Arena Code/WebDev. Las pruebas se realizaron contra Claude Haiku 4.5 con capacidades de pensamiento habilitadas. Los modelos se graficaron según los requisitos de memoria para implementación local.
Especificaciones técnicas
- Cuantización: Q4_K_M
- Longitud de contexto: 32K
- Caché KV: q8_0
- Estimación de VRAM: Calculada usando la calculadora personalizada del autor
Hallazgos clave
Ningún modelo de peso abierto por debajo de 100 GB de memoria se acerca al rendimiento de Claude Haiku en ninguno de los puntos de referencia. El competidor más cercano es Minimax M2.5, que requiere aproximadamente 136 GB de memoria y aproximadamente iguala el rendimiento de Haiku en ambos puntos de referencia.
El análisis destaca la brecha actual entre modelos propietarios y de peso abierto en la categoría por debajo de 100 GB para tareas de programación. El autor expresa frustración con esta limitación y hace un llamado para el desarrollo de modelos más pequeños que al menos puedan igualar las capacidades de Haiku.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Anthropic separa las suscripciones de Claude del uso de herramientas de terceros.
Anthropic dejará de cubrir el uso de OpenClaw con suscripciones Claude Pro/Team a partir del 4 de abril, requiriendo facturación por uso aparte para herramientas de terceros. Los usuarios deben habilitar 'uso adicional' en la configuración de su cuenta para seguir usando Claude a través de OpenClaw.

🚀 OpenClaw 2026.2.6 Lanzado – ¡Nuevos Modelos, Seguridad Mejorada y Actualizaciones Importantes!
OpenClaw 2026.2.6 lanza características revolucionarias, incluyendo nuevos modelos de IA y medidas de seguridad mejoradas. Sumérgete en las principales actualizaciones que están moldeando el futuro de la automatización.

Claude Code Subagentes No Carga Habilidades en Sistemas Multiagente
Un desarrollador informa que los subagentes en Claude Code v2.1.91 no pueden acceder a las habilidades definidas en el directorio .claude/skills/, a pesar de que las habilidades funcionan perfectamente en la sesión principal. Múltiples enfoques, incluyendo habilidades en el frontmatter del agente, la herramienta Skill, banderas CLI y Equipos de Agentes, todos fallan.

Ley de Alfabetización en IA K-12 Schiff-Rounds LIFT: Lo que los Desarrolladores Deben Saber
OpenAI, Google y Microsoft respaldan la Ley LIFT AI, que financia subvenciones de la NSF para planes de estudio de alfabetización en IA para K-12, capacitación docente y herramientas de evaluación.