Granite 4.1: Modelo Denso de 8B da IBM Iguala MoE de 32B em Benchmarks

✍️ OpenClawRadar📅 Publicado: April 30, 2026🔗 Source
Granite 4.1: Modelo Denso de 8B da IBM Iguala MoE de 32B em Benchmarks
Ad

A IBM lançou o Granite 4.1, uma família de modelos de linguagem de código aberto (Apache 2.0) com tamanhos de 3B, 8B e 30B. Todos usam um transformer denso apenas decoder — sem MoE, sem longas cadeias de raciocínio. O modelo de 8B se destaca: ele iguala ou supera o Granite 4.0-H-Small anterior (32B MoE, 9B ativos) em vários benchmarks.

Principais resultados de benchmark

  • ArenaHard (qualidade de prompts do mundo real): 8B pontua 69,0, MoE de 32B pontua menos.
  • BFCL V3 (chamada de ferramentas): 8B pontua 68,3, MoE de 32B pontua 64,7.
  • GSM8K (raciocínio matemático): 8B atinge 92,5.
  • AlpacaEval, MMLU-Pro, BBH, EvalPlus, MBPP: 8B supera consistentemente o modelo maior.
Ad

Pipeline de treinamento

O Granite 4.1 foi treinado em 15 trilhões de tokens em cinco fases com misturas de dados variáveis:

  • Fase 1: 59% CommonCrawl, 20% código, 7% matemática.
  • Fase 2: matemática salta para 35%, código para 30%.
  • Fases 3-4: combinação de raciocínio em cadeia de pensamento, dados de instrução e conteúdo web de alta qualidade.
  • Fase 5: extensão da janela de contexto para 512K tokens (8B e 30B).

A percepção principal: qualidade dos dados em vez de escala de parâmetros. O pipeline de filtragem de dados da IBM rejeita exemplos alucinados ou que ignoram instruções durante o ajuste fino para evitar treinar em sinais ruins.

Por que isso é importante para agentes de IA

Modelos densos oferecem latência e custo previsíveis — sem sobrecarga de roteamento. Para desenvolvedores que usam agentes de codificação de IA, o modelo de 8B do Granite 4.1 fornece forte uso de ferramentas e raciocínio matemático a uma fração do custo computacional de modelos MoE.

📖 Leia a fonte completa: HN AI Agents

Ad

👀 See Also

O redesign do painel do OpenClaw v2026.3.12 consolida os elementos da interface
News

O redesign do painel do OpenClaw v2026.3.12 consolida os elementos da interface

O OpenClaw v2026.3.12 apresenta um redesign completo do painel que consolida visualizações modulares para chat, configuração, agentes e sessões, juntamente com paleta de comandos, abas inferiores para mobile, comandos de barra, pesquisa, exportação e mensagens fixadas em uma única interface.

OpenClawRadar
Anthropic adquire Stainless por mais de $300M — Agora possui o gerador de servidor MCP dominante
News

Anthropic adquire Stainless por mais de $300M — Agora possui o gerador de servidor MCP dominante

Anthropic comprou a Stainless, geradora de SDKs, por mais de US$ 300 milhões. A Stainless gera a maioria dos servidores MCP de produção a partir de especificações OpenAPI. O produto hospedado está sendo descontinuado; novas inscrições foram interrompidas na segunda-feira.

OpenClawRadar
Vazamento do Código-Fonte do Claude Revela Modo Anti-Destilação, Modo Disfarçado e Detecção de Frustração
News

Vazamento do Código-Fonte do Claude Revela Modo Anti-Destilação, Modo Disfarçado e Detecção de Frustração

Um arquivo de mapa de código-fonte vazado do pacote npm do Claude Code revela técnicas anti-destilação usando ferramentas falsas, um modo secreto que oculta a autoria de IA e detecção de frustração via padrões de regex.

OpenClawRadar
Mistral Medium 3.5 128B Lançado: Modelo Denso com Raciocínio e Visão Configuráveis
News

Mistral Medium 3.5 128B Lançado: Modelo Denso com Raciocínio e Visão Configuráveis

A Mistral AI lançou o Mistral Medium 3.5, um modelo denso de 128B com contexto de 256k, esforço de raciocínio configurável e capacidades de visão, sob uma licença MIT modificada.

OpenClawRadar