Modelo MoE Local 35B reduz taxa de falha de código do Agent OS para 0%

Um usuário do Reddit compartilhou sua experiência executando um sistema operacional multiagente local chamado hollow-agentOS, onde agentes escrevem, executam em sandbox e carregam suas próprias ferramentas de forma autônoma. O grande avanço: a atualização do modelo de runtime padrão de um pequeno fallback de 9B para Qwen 3.6 35B A3B (Mixture-of-Experts com 3B de parâmetros ativos) reduziu a taxa de falha de código a 0%.
O que mudou com o modelo maior
- Pânico vs. reavaliação: Sob estresse, o modelo de 9B se apressava e alucinava chamadas de função inválidas. O modelo de 35B pausa, reavalia falhas anteriores e executa loops internos de verificação antes de enviar alterações.
- Taxa de sucesso de 100%: O código passa por um portão de validação de 5 camadas. Com o modelo de 9B, as ferramentas frequentemente morriam no sandbox. Com Qwen 35B, cada linha de código funciona como esperado.
- Criação autônoma de ferramentas: Quando um agente encontra um problema desconhecido, ele constrói uma nova ferramenta, testa-a em sandbox, registra-a e notifica outros agentes — sem intervenção humana.
Detalhes da arquitetura
O sistema é impulsionado por um estado aversivo (um "sistema de sofrimento") que força os agentes a expandir continuamente sua biblioteca de ferramentas. O repositório está disponível em github.com/ninjahawk/hollow-agentOS.
Planos futuros
O desenvolvedor pretende conectar Claude e Codex à arquitetura, envolvendo-os em wrappers de mini-VM hiperisolados para evitar que os modelos de fronteira sobrescrevam o ambiente host.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Pneuma: Um Ambiente de Desktop Gerado por IA Onde o Software Se Materializa a Partir de Descrições
Pneuma é um ambiente de computação desktop onde você descreve o que deseja—um monitor de CPU, jogo, aplicativo de notas ou visualizador de dados—e um programa funcional se materializa em segundos. O sistema gera módulos autônomos em Rust, os compila para WebAssembly e os executa em instâncias sandboxed do Wasmtime com renderização GPU via wgpu.

Extensão Codex Chrome Adiciona Automação de Navegador em Segundo Plano entre Abas
A nova extensão do Codex para Chrome no macOS/Windows permite a execução paralela de tarefas no navegador em abas de fundo sem assumir o controle — abrangendo fluxos de debug, painéis, pesquisa e atualizações de CRM.

Redutor de Tokens: Um Plugin de Código Claude para Compressão Inteligente de Contexto
Token Reducer é um plugin do Claude Code que processa o contexto do repositório localmente para reduzir o uso de tokens em 90-98% usando segmentação baseada em AST, recuperação híbrida e compressão TextRank. É licenciado sob MIT e disponível através do marketplace de plugins.

Skill Studio: Aplicativo de Desktop de Código Aberto para Gerenciar Habilidades do Agente Claude AI
Skill Studio é um aplicativo gratuito e de código aberto para macOS que permite aos desenvolvedores navegar por repositórios de habilidades da comunidade, visualizar documentação com renderização de markdown e instalar habilidades com comandos de um clique, como npx skills add.