ATLAS: Pipeline de Computación en Tiempo de Prueba de Código Abierto para Qwen3-14B Logra Rendimiento de Codificación de Nivel Frontera

✍️ OpenClawRadar📅 Publicado: 10 de marzo de 2026🔗 Source
ATLAS: Pipeline de Computación en Tiempo de Prueba de Código Abierto para Qwen3-14B Logra Rendimiento de Codificación de Nivel Frontera
Ad

ATLAS es una canalización de cómputo en tiempo de prueba de código abierto basada en Qwen3-14B que logra un rendimiento de codificación comparable a modelos de vanguardia a un costo significativamente menor. El proyecto fue desarrollado por un estudiante de administración de empresas en Virginia Tech que aprendió a programar mientras lo construía.

Evolución del Desarrollo

El desarrollador pasó de dos a tres meses investigando cientos de artículos para conectar investigaciones existentes que no se habían combinado antes. El sistema evolucionó a través de tres versiones principales:

  • V1: Infraestructura básica, descrita como "MUY rudimentaria (esencialmente solo RAG)"
  • V2: Aplicó verificación basada en energía inspirada en el artículo de Anthropic "When Models Manipulate Manifolds", resultando en un verificador decente
  • V3: Duplicó el rendimiento sobre la línea base V1 después de una extensa investigación que incluyó la exploración del Problema de la Parada

Puntos de Referencia de Rendimiento

Resultados en 599 problemas de LiveCodeBench v5:

  • DeepSeek V3.2 Reasoning: 86,2% pass@1, ~$0,002 por tarea (API)
  • GPT-5 (alto): 84,6% pass@1, ~$0,043 por tarea (API)
  • ATLAS V3: 74,6% pass@1, ~$0,004 por tarea (electricidad)
  • Claude 4.5 Sonnet: 71,4% pass@1, ~$0,066 por tarea (API)
Ad

Detalles Técnicos y Limitaciones

El sistema es "lento como el infierno" según el desarrollador. Las tareas fáciles toman segundos, pero los problemas complejos de codificación pueden tomar hasta una hora. La V3.1 está migrando a Qwen 3.5 9B para mejorar la velocidad y la paralelización.

ATLAS incluye infraestructura completa de MaaS (Modelo como Servicio) que permite conectar OpenCode o Claude Code a través de API. El desarrollador recomienda al menos 16 GB de VRAM, advirtiendo que con menos memoria será "incluso más lento de lo que mencioné".

Configuración y Reproducibilidad

El proyecto es completamente de código abierto sin planes de comercialización. El repositorio está disponible en https://github.com/itigges22/ATLAS. El desarrollador señala que la reproducibilidad necesita trabajo, pero sugiere que "si le pides a Claude Code que lo optimice para tu configuración, debería funcionar bien".

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Consulta Tu Sprint de Jira Mediante Claude MCP: Estado Instantáneo, Incidencias Sin Asignar y Elementos Bloqueados
Herramientas

Consulta Tu Sprint de Jira Mediante Claude MCP: Estado Instantáneo, Incidencias Sin Asignar y Elementos Bloqueados

Un usuario de Reddit conectó Jira a Claude mediante MCP, luego hizo preguntas en lenguaje natural sobre su sprint y obtuvo tablas limpias al instante, sin tener que hacer clic en los tableros.

OpenClawRadar
Los Vectores de Emoción Interna 171 de Claude Influyen en la Salida: Kit de Herramientas Basado en la Investigación de Anthropic
Herramientas

Los Vectores de Emoción Interna 171 de Claude Influyen en la Salida: Kit de Herramientas Basado en la Investigación de Anthropic

El documento de investigación de Anthropic revela que Claude tiene 171 patrones de activación interna que funcionan como vectores emocionales, impulsando causalmente su comportamiento antes de escribir. Un desarrollador creó un kit de herramientas con 7 principios prácticos de indicación y mensajes del sistema basados en estos hallazgos.

OpenClawRadar
SecureContext: Un complemento MCP para memoria persistente y reducción de tokens en Claude Code
Herramientas

SecureContext: Un complemento MCP para memoria persistente y reducción de tokens en Claude Code

SecureContext es un complemento MCP de código abierto que proporciona persistencia al estilo MemGPT entre sesiones de Claude Code, reduce los tokens de entrada en aproximadamente un 87% mediante la recuperación de contexto dirigida y aísla las credenciales mediante un entorno de seguridad.

OpenClawRadar
Hipocampo: Un Sistema de Memoria Persistente para Agentes de IA Utilizando Árboles de Compactación
Herramientas

Hipocampo: Un Sistema de Memoria Persistente para Agentes de IA Utilizando Árboles de Compactación

Hipocampus aborda el problema de que los agentes de IA olviden el contexto entre sesiones mediante la implementación de un árbol de compactación que comprime el historial de conversación a través de cinco niveles: crudo → diario → semanal → mensual → raíz, con un índice de temas llamado ROOT.md.

OpenClawRadar