Puntos de Referencia de Rendimiento de LLM Local en Mac Mini con OpenClaw y LM Studio

✍️ OpenClawRadar📅 Publicado: 18 de abril de 2026🔗 Source

Un usuario de Reddit compartió puntos de referencia concretos de rendimiento para ejecutar un modelo de lenguaje grande localmente en un Mac Mini con 32 GB de RAM. La publicación aborda la escasez de datos de rendimiento específicos para esta configuración de hardware.

Detalles de la configuración técnica

El usuario reportó la siguiente configuración y resultados:

Versiones de software: OpenClaw 2026.3.8, LM Studio 0.4.6+1
Modelo: Unsloth gpt-oss-20b-Q4_K_S.gguf
Tamaño de contexto: 26035
Métricas de rendimiento: 34 tokens/segundo después del primer prompt, 0.7 segundos de tiempo para el primer token

Configuración del modelo

El usuario especificó estas configuraciones del modelo (todas en valores predeterminados):

GPU offload = 18
Tamaño del grupo de hilos de CPU = 7
Máximo de concurrentes = 4
Número de expertos = 4
Atención flash = activada

La cuantización Q4_K_S indica que esta es una versión cuantizada de 4 bits del modelo de 20 mil millones de parámetros, lo que reduce los requisitos de memoria mientras mantiene un rendimiento razonable. Los 32 GB de RAM en el Mac Mini son suficientes para este tamaño de modelo con la longitud de contexto dada. El rendimiento de 34 tokens/segundo es un punto de referencia práctico para desarrolladores que consideran configuraciones locales similares de LLM en hardware Apple Silicon.

📖 Read the full source: r/openclaw

👀 Ver también

Herramientas

Cerebro Abierto: El servidor MCP de código abierto agrega memoria persistente con auto-grafo y búsqueda semántica a Claude

Open Brain es un servidor MCP de código abierto que proporciona a Claude memoria persistente entre sesiones con extracción automática de entidades, deduplicación semántica y creación automática de gráficos de conexiones entre pensamientos. Utiliza Supabase con pgvector y Deno Edge Functions, es autoalojable e incluye 16 herramientas MCP para recorrido de grafos, navegación de entidades y síntesis de revisiones semanales.

15 abr 2026, 13:45 UTC

OpenClawRadar

Herramientas

Rever UI Cloner: Alternativa Optimizada por IA para la Replicación de UI en lugar del Scraping HTML

Rever UI Cloner es un endpoint API que proporciona a los agentes de IA planos de diseño limpios en lugar de HTML crudo, evitando la saturación de la ventana de contexto y los problemas de alucinación de la interfaz de usuario. Utiliza el protocolo de pago x402 que requiere una microtransacción de 1 USDC en la red Base para pagos entre agentes.

27 feb 2026, 11:45 UTC

OpenClawRadar

Herramientas

Claude Code v2.1.90 añade soporte para el mouse con la bandera CLAUDE_CODE_NO_FLICKER

Anthropic lanzó Claude Code v2.1.90 con una nueva función que habilita el soporte de ratón en la interfaz de chat. Los usuarios pueden activarlo configurando la variable de entorno CLAUDE_CODE_NO_FLICKER=1 antes de ejecutar claude.

21 abr 2026, 00:29 UTC

OpenClawRadar

Herramientas

AgentCall: Deja que Claude Code se una a llamadas de Google Meet, Zoom o Teams como compañero de equipo

AgentCall.dev permite que tu sesión existente de Claude Code, Codex o Cursor participe en Google Meet, Teams o Zoom con voz, pantalla compartida y chat — sin captura de escritorio ni datos de terceros en modo directo.

24 abr 2026, 02:15 UTC

OpenClawRadar