NVIDIA DGX Spark Community lanza Spark Arena para benchmarks reproducibles de LLM.

✍️ OpenClawRadar📅 Publicado: 1 de marzo de 2026🔗 Source

La comunidad NVIDIA DGX Spark ha establecido Spark Arena, una plataforma de evaluación reproducible para modelos de lenguaje grandes de pesos abiertos en hardware DGX Spark, abordando problemas anteriores con informes inconsistentes.

Antecedentes y Problema

NVIDIA comenzó a enviar DGX Spark a mediados de octubre de 2025 como una caja de escritorio con memoria unificada capaz de ejecutar modelos grandes localmente, incluidos modelos de ~200B parámetros para inferencia. La comunidad identificó un problema recurrente donde "todos publican resultados parciales, y luego nadie puede reproducirlos dos semanas después".

Metodología Estandarizada

El 14 de octubre de 2025, u/ggerganov publicó un hilo de rendimiento de DGX Spark en llama.cpp con una metodología clara: medir prellenado (pp) y generación/decoficación (tg) en múltiples profundidades de contexto y tamaños de lote, utilizando compilaciones CUDA de llama.cpp con llama-bench y llama-batched-bench.

Solución Comunitaria

La comunidad acordó herramientas estandarizadas para la construcción de imágenes de tiempo de ejecución, orquestación y formato de recetas, lanzando Spark Arena el 11 de febrero de 2026.

Líderes Actuales de Rendimiento

Principales resultados de tokens/seg de decodificación de Spark Arena:

gpt-oss-120b (vLLM, MXFP4, 2 nodos): 75.96 tok/s
Qwen3-Coder-Next (SGLang, FP8, 2 nodos): 60.51 tok/s
gpt-oss-120b (vLLM, MXFP4, nodo único): 58.82 tok/s
NVIDIA-Nemotron-3-Nano-30B-A3B (vLLM, NVFP4, nodo único): 56.11 tok/s

Implicaciones Prácticas

Este enfoque estandarizado proporciona a los desarrolladores datos de rendimiento confiables para seleccionar y configurar LLM de pesos abiertos en hardware DGX Spark, permitiendo decisiones mejor informadas sobre implementación y optimización de modelos.

📖 Read the full source: r/clawdbot

👀 Ver también

Noticias

Una tienda low-code de 50 desarrolladores se desvaneció en 12 meses: La trampa de dependencia de los agentes de codificación de IA

Una tienda low-code de 50 personas perdió todos sus clientes en 12 meses porque 'low-code + IA' supera al low-code puro y al full-stack. Mientras tanto, un desarrollador en solitario que depende de Claude Max enfrenta límites de sesión y costos crecientes. Ambos ilustran el mismo dilema: adaptarse o depender.

10 may 2026, 10:18 UTC

OpenClawRadar

Noticias

Nvidia compromete $26B en modelos de IA de pesos abiertos, lanza Nemotron 3 Super

Nvidia gastará $26 mil millones en cinco años para construir modelos de IA de código abierto, según los informes financieros de 2025. La compañía también lanzó Nemotron 3 Super, un modelo de 128B parámetros que supera a GPT-OSS en puntos de referencia y ocupa el primer lugar en PinchBench para el control de OpenClaw.

12 mar 2026, 03:45 UTC

OpenClawRadar

Noticias

El 61% de las personas utiliza ahora la IA para apoyo en salud mental — Encuesta global AXA/Ipsos

El 61% de las personas en 18 países ya usan IA para salud mental; el 28% dice que las recomendaciones de IA llevaron a conductas dañinas, según el Informe de Salud Mental AXA/Ipsos 2026.

20 jun 2026, 00:15 UTC

OpenClawRadar

Noticias

Claude Code v2.1.119: Persistencia de configuración, soporte para PRs de GitLab/Bitbucket y docenas de correcciones de errores

Claude Code v2.1.119 persiste la configuración /config en ~/.claude/settings.json, añade soporte --from-pr para MR de GitLab y PR de Bitbucket, y corrige más de 25 errores, incluyendo pegado CRLF, OAuth de MCP y conflictos de modo automático.

24 abr 2026, 00:15 UTC

OpenClawRadar