Lightning MLX: Motor de AI local rápido para uso agente en Apple Silicon ofrece 220 tok/s en Qwen 35B-A3B

✍️ OpenClawRadar📅 Publicado: 8 de mayo de 2026🔗 Source

Un nuevo motor de inferencia de código abierto para Apple Silicon llamado Lightning MLX afirma ser el motor de IA local más rápido, específicamente optimizado para flujos de trabajo agénticos — agentes de código, llamadas a herramientas y tareas de respuesta corta. El proyecto está disponible en GitHub en samuelfaj/lightning-mlx.

Resultados de Benchmark

El autor probó en un MacBook Max M5 con 128 GB de RAM e informó las siguientes velocidades de generación de tokens:

Qwen3.6-27B: 40.67 tok/s
Qwen3.6-35B-A3B: 220.86 tok/s

Estos resultados sugieren que el motor es particularmente eficiente para la arquitectura de mezcla de expertos utilizada en el modelo Qwen3.6-35B-A3B, que activa solo un subconjunto de parámetros por token.

Características Clave

Optimizado para casos de uso agénticos de respuesta corta — generación de código, llamadas a herramientas y bucles de inferencia rápida
Incluye una configuración preestablecida llamada MTPLX (valores predeterminados de muestreo personalizados); el autor busca comentarios sobre si estos valores predeterminados tienen sentido para uso en producción
Código abierto bajo la licencia MIT (probablemente) en GitHub

Solicitudes de Comentarios

El creador está pidiendo activamente a la comunidad:

Mejores diseños de benchmark para agentes de código locales
Opiniones sobre los valores predeterminados del preset MTPLX
Resultados de pruebas en otras configuraciones de Apple Silicon (por ejemplo, M1, M2, M3, M4, diferentes tamaños de RAM)

Para Quién Es

Desarrolladores que ejecutan LLMs locales en Apple Silicon para flujos de trabajo agénticos de codificación que necesitan máxima velocidad de inferencia.

📖 Leer la fuente completa: r/LocalLLaMA

👀 Ver también

Herramientas

Clawforce: Plano de Control de Código Abierto para Gestionar Equipos de Agentes Clawbot

Clawforce es un plano de control de código abierto para gestionar equipos de agentes Clawbot que permite el despliegue con unos pocos clics. Proporciona configuración de personajes, habilidades, integraciones MCP y herramientas a través de una interfaz de usuario, con agentes capaces de planificar, coordinar y ejecutar tareas de manera colaborativa.

19 abr 2026, 05:45 UTC

OpenClawRadar

Herramientas

Observación: Una Herramienta de Anotación en Markdown para Flujos de Trabajo de Código en Claude

Remark es una aplicación nativa para macOS que permite a los desarrolladores anotar archivos Markdown en línea para flujos de trabajo de revisión de código en Claude Code. Exporta las anotaciones como JSON para el agente y se integra mediante una habilidad instalada en el directorio .claude/skills/.

24 feb 2026, 15:45 UTC

OpenClawRadar

Herramientas

Resultados de Referencia: 6 Modelos de Bajo Costo vs. Claude Sonnet 4.6 para la Orquestación de OpenClaw

Un desarrollador probó seis modelos de IA más económicos frente a Claude Sonnet 4.6 como orquestador principal para una configuración OpenClaw. Solo o4-mini igualó la puntuación perfecta de Sonnet, mientras que los demás fallaron en tareas críticas de juicio como la inspección de archivos y la delegación.

17 mar 2026, 07:45 UTC

OpenClawRadar

Herramientas

Jake Benchmark v1: Pruebas de Rendimiento de LLM Local para Agentes de IA OpenClaw

Un desarrollador probó 7 LLM locales como agentes de IA con OpenClaw utilizando 22 tareas prácticas que incluyen procesamiento de correos electrónicos, programación de reuniones y detección de phishing. Los resultados variaron desde un 59.4% para Qwen 27B hasta un 1.6% para Nemotron 30B, con registros detallados de conversaciones disponibles.

23 mar 2026, 19:45 UTC

OpenClawRadar