ATLAS Open Source: Pipeline Qwen3-14B Logra 74.6% en LiveCodeBench

ATLAS es una canalización de cómputo en tiempo de prueba de código abierto basada en Qwen3-14B que logra un rendimiento de codificación comparable a modelos de vanguardia a un costo significativamente menor. El proyecto fue desarrollado por un estudiante de administración de empresas en Virginia Tech que aprendió a programar mientras lo construía.

Evolución del Desarrollo

El desarrollador pasó de dos a tres meses investigando cientos de artículos para conectar investigaciones existentes que no se habían combinado antes. El sistema evolucionó a través de tres versiones principales:

V1: Infraestructura básica, descrita como "MUY rudimentaria (esencialmente solo RAG)"
V2: Aplicó verificación basada en energía inspirada en el artículo de Anthropic "When Models Manipulate Manifolds", resultando en un verificador decente
V3: Duplicó el rendimiento sobre la línea base V1 después de una extensa investigación que incluyó la exploración del Problema de la Parada

Puntos de Referencia de Rendimiento

Resultados en 599 problemas de LiveCodeBench v5:

DeepSeek V3.2 Reasoning: 86,2% pass@1, ~$0,002 por tarea (API)
GPT-5 (alto): 84,6% pass@1, ~$0,043 por tarea (API)
ATLAS V3: 74,6% pass@1, ~$0,004 por tarea (electricidad)
Claude 4.5 Sonnet: 71,4% pass@1, ~$0,066 por tarea (API)

Detalles Técnicos y Limitaciones

El sistema es "lento como el infierno" según el desarrollador. Las tareas fáciles toman segundos, pero los problemas complejos de codificación pueden tomar hasta una hora. La V3.1 está migrando a Qwen 3.5 9B para mejorar la velocidad y la paralelización.

ATLAS incluye infraestructura completa de MaaS (Modelo como Servicio) que permite conectar OpenCode o Claude Code a través de API. El desarrollador recomienda al menos 16 GB de VRAM, advirtiendo que con menos memoria será "incluso más lento de lo que mencioné".

Configuración y Reproducibilidad

El proyecto es completamente de código abierto sin planes de comercialización. El repositorio está disponible en https://github.com/itigges22/ATLAS. El desarrollador señala que la reproducibilidad necesita trabajo, pero sugiere que "si le pides a Claude Code que lo optimice para tu configuración, debería funcionar bien".

📖 Read the full source: r/LocalLLaMA

ATLAS: Pipeline de Computación en Tiempo de Prueba de Código Abierto para Qwen3-14B Logra Rendimiento de Codificación de Nivel Frontera

Evolución del Desarrollo

Puntos de Referencia de Rendimiento

Detalles Técnicos y Limitaciones

Configuración y Reproducibilidad

👀 Ver también

Consulta Tu Sprint de Jira Mediante Claude MCP: Estado Instantáneo, Incidencias Sin Asignar y Elementos Bloqueados

Los Vectores de Emoción Interna 171 de Claude Influyen en la Salida: Kit de Herramientas Basado en la Investigación de Anthropic

SecureContext: Un complemento MCP para memoria persistente y reducción de tokens en Claude Code

Hipocampo: Un Sistema de Memoria Persistente para Agentes de IA Utilizando Árboles de Compactación