Puntos de Referencia de Rendimiento de LLM Local en Mac Mini con OpenClaw y LM Studio

Un usuario de Reddit compartió puntos de referencia concretos de rendimiento para ejecutar un modelo de lenguaje grande localmente en un Mac Mini con 32 GB de RAM. La publicación aborda la escasez de datos de rendimiento específicos para esta configuración de hardware.
Detalles de la configuración técnica
El usuario reportó la siguiente configuración y resultados:
- Versiones de software: OpenClaw 2026.3.8, LM Studio 0.4.6+1
- Modelo: Unsloth gpt-oss-20b-Q4_K_S.gguf
- Tamaño de contexto: 26035
- Métricas de rendimiento: 34 tokens/segundo después del primer prompt, 0.7 segundos de tiempo para el primer token
Configuración del modelo
El usuario especificó estas configuraciones del modelo (todas en valores predeterminados):
- GPU offload = 18
- Tamaño del grupo de hilos de CPU = 7
- Máximo de concurrentes = 4
- Número de expertos = 4
- Atención flash = activada
La cuantización Q4_K_S indica que esta es una versión cuantizada de 4 bits del modelo de 20 mil millones de parámetros, lo que reduce los requisitos de memoria mientras mantiene un rendimiento razonable. Los 32 GB de RAM en el Mac Mini son suficientes para este tamaño de modelo con la longitud de contexto dada. El rendimiento de 34 tokens/segundo es un punto de referencia práctico para desarrolladores que consideran configuraciones locales similares de LLM en hardware Apple Silicon.
📖 Read the full source: r/openclaw
👀 Ver también

Audacity-MCP: Integración de Claude AI para Edición de Audio Local con 131 Herramientas
Audacity-MCP conecta a Claude con Audacity mediante una interfaz de tubería, permitiendo la edición de audio controlada por voz con 131 herramientas, 9 flujos de trabajo automatizados y transcripción local con Whisper sin dependencias en la nube.

Sala de Agentes: Aplicación de Escritorio para Visualizar Equipos de Agentes de Código Claude
Agents Room es una aplicación de escritorio basada en Electron que escanea las carpetas .claude/agents/, lee los metadatos frontmatter y visualiza las relaciones entre agentes en un lienzo con líneas de conexión automáticas. Permite crear/editar agentes, habilidades y comandos directamente en la interfaz de usuario en lugar de editar archivos markdown.

Andamio de Habilidades: Construye Habilidades de OpenClaw Sin Escribir Código
Skill Scaffolder es una herramienta de código abierto que permite a los usuarios crear habilidades para OpenClaw describiendo lo que quieren en inglés sencillo. Maneja todo el proceso—entrevistando a los usuarios, escribiendo archivos de habilidad, probando e instalando—sin requerir archivos YAML, Python o de configuración.

Codegraph: Los cortes del grafo de conocimiento preindexado reducen las llamadas de herramientas Claude/Cursor en un 94%
Codegraph utiliza un grafo de conocimiento preindexado de relaciones entre símbolos, grafos de llamadas y estructura de código para reducir las llamadas a la API hasta en un 94% y acelerar el uso en aproximadamente un 77% para agentes de Claude, Cursor, Codex y OpenCode.