Modelos Locais vs Nuvem: Qwen-3.6-27B, Gemma-4-31B, Claude Haiku, Codex-Spark em Geração de Código Complexo

✍️ OpenClawRadar📅 Publicado: April 30, 2026🔗 Source
Modelos Locais vs Nuvem: Qwen-3.6-27B, Gemma-4-31B, Claude Haiku, Codex-Spark em Geração de Código Complexo
Ad

Um usuário do Reddit comparou o Qwen-3.6-27B (GGUF q4_k_m) executado localmente com equivalentes de API: Qwen-3.6-27B via OpenRouter, Gemma-4-31B via OpenRouter, Claude Haiku 4.5 e GPT-Codex-Spark. O teste envolveu implementar um loop de autopesquisa a partir de um documento de design — uma tarefa deliberadamente difícil para avaliar a clareza das falhas, não a taxa de sucesso.

Configuração de Hardware

  • CPU: Ryzen 7 7800X3D
  • RAM: 64 GB DDR5-6400
  • GPU: RTX 5080 (16 GB VRAM)
  • Modelo local: Qwen-3.6-27B q4_k_m (GGUF) — cabe em 16 GB VRAM via quantização

Resultados

  • Gemma-4-31B (API): Falhou completamente. Escreveu um esqueleto com módulos simulados, sem testes, sem arquivos de configuração (__init__.py, requirements.txt, pyproject.toml). Custo: $0,112, 803k tokens de contexto consumidos, 21k gerados.
  • Codex-Spark (API): Produziu uma bela estrutura de pastas e código, mas as importações foram alucinadas. Nenhum teste unitário. Usou 1% dos limites do Spark de $100/mês.
  • Claude Haiku 4.5 (API): Implementação detalhada, mas falhou na correção. (Mais detalhes truncados na fonte.)
  • Qwen-3.6-27B (local q4_k_m): Não foi explicitamente pontuado, mas o usuário observa que a inferência quantizada degrada a qualidade em comparação com a versão API de precisão total.
Ad

Contexto

O usuário argumenta que as avaliações típicas de modelos locais usam tarefas triviais (ex.: Snake em HTML) onde tanto modelos locais quanto de fronteira são bem-sucedidos, fazendo os modelos locais parecerem melhores do que são. Este teste usou um projeto de trabalho real com um documento de design; apenas o Codex-Spark produziu código totalmente escrito (mas quebrado). O ponto: modelos locais ainda não estão prontos para geração de código complexa sem correções substanciais.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Claude-Code v2.1.88 Lançamento: Renderização Sem Cintilação, Hooks de Permissão e Correções Críticas
News

Claude-Code v2.1.88 Lançamento: Renderização Sem Cintilação, Hooks de Permissão e Correções Críticas

O Claude-Code v2.1.88 introduz uma opção de renderização sem cintilação via CLAUDE_CODE_NO_FLICKER=1, adiciona um gancho PermissionDenied para tentativas automáticas de repetição e corrige vazamentos de memória, travamentos e problemas de renderização em terminais Windows, macOS e Linux.

OpenClawRadar
Claude-Code v2.1.91 adiciona persistência de resultados MCP, controles de execução de shell e deep links multilinha
News

Claude-Code v2.1.91 adiciona persistência de resultados MCP, controles de execução de shell e deep links multilinha

Claude-Code v2.1.91 introduz a substituição de persistência de resultados de ferramentas MCP via anotação _meta["anthropic/maxResultSizeChars"] suportando até 500 mil caracteres, adiciona a configuração disableSkillShellExecution e habilita prompts de múltiplas linhas em deep links claude-cli://open?q= com novas linhas codificadas.

OpenClawRadar
Claude Code v2.1.68: Opus 4.6 define esforço médio como padrão e reintroduz a palavra-chave ultrathink
News

Claude Code v2.1.68: Opus 4.6 define esforço médio como padrão e reintroduz a palavra-chave ultrathink

A versão 2.1.68 do Claude Code altera o nível de esforço padrão do Opus 4.6 para médio para assinantes Max e Team, reintroduz a palavra-chave 'ultrathink' para alto esforço e remove os modelos mais antigos Opus 4 e 4.1 da API oficial.

OpenClawRadar
Google Chrome instala silenciosamente modelo de IA Gemini Nano de 4 GB – sem consentimento do usuário
News

Google Chrome instala silenciosamente modelo de IA Gemini Nano de 4 GB – sem consentimento do usuário

Descobriu-se que o Google Chrome baixa e instala silenciosamente o modelo de IA Gemini Nano de 4 GB em dispositivos dos usuários sem consentimento explícito, gerando preocupações com privacidade e armazenamento.

OpenClawRadar