Benchmarks de Desempenho de LLM Local no Mac Mini com OpenClaw e LM Studio

✍️ OpenClawRadar📅 Publicado: April 18, 2026🔗 Source
Benchmarks de Desempenho de LLM Local no Mac Mini com OpenClaw e LM Studio
Ad

Um usuário do Reddit compartilhou benchmarks de desempenho concretos para executar um modelo de linguagem grande localmente em um Mac Mini com 32GB de RAM. A publicação aborda a escassez de dados específicos de desempenho para esta configuração de hardware.

Detalhes da Configuração Técnica

O usuário relatou a seguinte configuração e resultados:

  • Versões de software: OpenClaw 2026.3.8, LM Studio 0.4.6+1
  • Modelo: Unsloth gpt-oss-20b-Q4_K_S.gguf
  • Tamanho do contexto: 26035
  • Métricas de desempenho: 34 tokens/segundo após o primeiro prompt, 0,7 segundo de tempo para o primeiro token
Ad

Configuração do Modelo

O usuário especificou estas configurações do modelo (todas nos padrões):

  • GPU offload = 18
  • Tamanho do pool de threads da CPU = 7
  • Máximo de concorrentes = 4
  • Número de especialistas = 4
  • Flash attention = ativado

A quantização Q4_K_S indica que esta é uma versão quantizada de 4 bits do modelo de 20 bilhões de parâmetros, que reduz os requisitos de memória enquanto mantém um desempenho razoável. Os 32GB de RAM no Mac Mini são suficientes para este tamanho de modelo com o comprimento de contexto fornecido. A taxa de transferência de 34 tokens/segundo é um benchmark prático para desenvolvedores que consideram configurações locais semelhantes de LLM em hardware Apple Silicon.

📖 Read the full source: r/openclaw

Ad

👀 See Also

Usuário do Reddit Testa Recurso de Autoaprendizado do Agente de IA Hermes, Encontra Falhas Críticas
Tools

Usuário do Reddit Testa Recurso de Autoaprendizado do Agente de IA Hermes, Encontra Falhas Críticas

Um usuário do Reddit testou o recurso de autoaprendizagem do agente de IA Hermes, que cria habilidades automaticamente a partir de arquivos markdown. O usuário descobriu que ele sempre avalia seus próprios resultados como bem-sucedidos, mesmo quando a saída está incorreta, e sobrescreve edições manuais.

OpenClawRadar
Índices Persistentes Sobre Extração: Arquitetura para um Servidor MCP do YouTube
Tools

Índices Persistentes Sobre Extração: Arquitetura para um Servidor MCP do YouTube

Um desenvolvedor compartilha notas de arquitetura para construir um servidor MCP do YouTube que usa índices locais persistentes em vez do padrão comum de extrair-e-esquecer. As decisões principais incluem um sistema de fallback de três camadas, SQLite + sqlite-vec para armazenamento vetorial, abstração de provedor de embeddings e um índice de busca visual separado.

OpenClawRadar
Lista Curada de Mais de 260 Ferramentas de Agentes de IA com Destaques do Ecossistema Claude
Tools

Lista Curada de Mais de 260 Ferramentas de Agentes de IA com Destaques do Ecossistema Claude

Um repositório do GitHub contém uma lista curada de mais de 260 ferramentas de agentes de IA, incluindo entradas específicas relacionadas ao Claude, como Claude Code (80,9% SWE-bench), Claude Computer Use e Claude in Chrome, além de ferramentas que funcionam bem com o Claude, como Cline e Cursor.

OpenClawRadar
Dois Ferramentas MCP para Claude Code: Validação de Ideia e Memória do Agente de Negociação
Tools

Dois Ferramentas MCP para Claude Code: Validação de Ideia e Memória do Agente de Negociação

Um desenvolvedor criou duas ferramentas MCP para Claude Code: idea-reality-mcp verifica o GitHub e o Hacker News antes de programar para evitar duplicatas, enquanto tradememory-protocol fornece memória para agentes de IA de trading armazenarem negociações com contexto e acompanharem o desempenho da estratégia. Ambas são de código aberto e estão disponíveis no PyPI.

OpenClawRadar