Puntos de Referencia de Rendimiento de LLM Local en Mac Mini con OpenClaw y LM Studio

Un usuario de Reddit compartió puntos de referencia concretos de rendimiento para ejecutar un modelo de lenguaje grande localmente en un Mac Mini con 32 GB de RAM. La publicación aborda la escasez de datos de rendimiento específicos para esta configuración de hardware.
Detalles de la configuración técnica
El usuario reportó la siguiente configuración y resultados:
- Versiones de software: OpenClaw 2026.3.8, LM Studio 0.4.6+1
- Modelo: Unsloth gpt-oss-20b-Q4_K_S.gguf
- Tamaño de contexto: 26035
- Métricas de rendimiento: 34 tokens/segundo después del primer prompt, 0.7 segundos de tiempo para el primer token
Configuración del modelo
El usuario especificó estas configuraciones del modelo (todas en valores predeterminados):
- GPU offload = 18
- Tamaño del grupo de hilos de CPU = 7
- Máximo de concurrentes = 4
- Número de expertos = 4
- Atención flash = activada
La cuantización Q4_K_S indica que esta es una versión cuantizada de 4 bits del modelo de 20 mil millones de parámetros, lo que reduce los requisitos de memoria mientras mantiene un rendimiento razonable. Los 32 GB de RAM en el Mac Mini son suficientes para este tamaño de modelo con la longitud de contexto dada. El rendimiento de 34 tokens/segundo es un punto de referencia práctico para desarrolladores que consideran configuraciones locales similares de LLM en hardware Apple Silicon.
📖 Read the full source: r/openclaw
👀 Ver también

Monitor Gratuito de la Barra de Menús de macOS para los Límites de Uso de Claude AI
Una herramienta gratuita y de código abierto para macOS que muestra el porcentaje de uso de sesión de Claude AI, los límites semanales y las cuentas regresivas de reinicio directamente en tu barra de menú. Se instala con un solo comando de Homebrew y aprovecha las sesiones existentes de Chrome sin almacenar datos.

Toothcomb: Verificador de hechos de voz en tiempo real de código abierto creado con las API de Claude Opus y Sonnet
Toothcomb es una herramienta de código abierto que toma una transcripción de un discurso, verifica afirmaciones, detecta falacias lógicas y lenguaje manipulativo usando la API de Claude Opus, y admite transmisión en tiempo real desde el micrófono.

aco-system: Un Sistema Operativo Completo para Empresas para Claude que Escribe Historias de Usuario, Divide Tareas y Revisa PRs
Un usuario de Reddit compartió cómo aco-system convirtió un solo issue de GitHub en un PR completamente validado con tests — impulsado enteramente por Claude. Incluye generación de historias de usuario, desglose de tareas, verificación de secretos y revisión de PR.

claude-sessions: Interfaz de Usuario en Terminal para Navegar Transcripciones de Código de Claude
claude-sessions es una herramienta de interfaz de usuario de terminal de código abierto que escanea archivos de transcripción locales de Claude Code, permitiendo a los desarrolladores navegar, buscar y reanudar sesiones anteriores. Construida con el propio Claude Code, cuenta con navegación WASD, búsqueda por palabras clave y reanudación de sesiones con un solo clic.