Revisão de Desempenho do Omnicoder-9B: Velocidade vs. Problemas de Chamada de Ferramentas

✍️ OpenClawRadar📅 Publicado: April 18, 2026🔗 Source
Revisão de Desempenho do Omnicoder-9B: Velocidade vs. Problemas de Chamada de Ferramentas
Ad

Visão Geral Técnica

Omnicoder-9B é um modelo específico para programação desenvolvido pela Tesslate, baseado na arquitetura Qwen 3.5. Ele foi ajustado sobre o Qwen3.5 9B usando saídas de vários modelos, incluindo Opus 4.6, GPT 5.4, GPT 5.3 Codex e Gemini 3.1 Pro.

Características de Desempenho

O modelo demonstra um desempenho forte em hardware de médio porte. Com 12 GB de VRAM, usuários relatam geração consistente de tokens a 15 tokens/segundo mesmo com o tamanho do contexto definido em 100k. O processamento de prompts é notavelmente rápido, com aproximadamente 265 tokens/segundo. O modelo funciona sem travar sistemas ou causar degradação de desempenho.

Limitações e Problemas

Apesar das vantagens de velocidade, o Omnicoder-9B mostra várias limitações em cenários práticos de programação:

  • Falhou em gerar um clone completo do Super Mario em um arquivo HTML independente com um prompt único
  • Experimentou falhas na chamada de ferramentas com servidores MCP, gerando erros MCP durante a busca de dados
  • Problemas ao executar chamadas de ferramentas de escrita do Claude Code, embora isso possa envolver fatores de compatibilidade
Ad

Testes de Integração em IDE

Testes em ambientes de desenvolvimento revelaram resultados mistos:

  • No LM Studio com Roo Code: Ocorreram desconexões conforme o tamanho do token aumentava para 4k, embora isso pareça ser um problema de integração e não específico do modelo
  • O modelo atualizou ou escreveu pequenos scripts com sucesso com tamanhos de token entre 2-3k
  • Solicitações de API falharam para tokens acima de 4k sem mensagens de erro
  • No Claude Code: A geração de tokens pareceu mais lenta em comparação com o Roo Code, e o modelo falhou em executar chamadas de ferramentas de escrita após gerar a saída

O usuário observa que o Roo Code tem sido a extensão mais eficaz para LLMs locais entre Continue e outras opções testadas.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Contextium: Framework de Contexto Persistente de Código Aberto para Claude Code
Tools

Contextium: Framework de Contexto Persistente de Código Aberto para Claude Code

Contextium é um framework estruturado de repositório git que fornece contexto persistente para sessões do Claude Code, usando um arquivo CLAUDE.md como roteador de contexto para carregar sob demanda arquivos markdown relevantes. A versão de código aberto inclui um modelo com 6 aplicativos de exemplo e 27 documentos de integração.

OpenClawRadar
Engenharia reversa do protocolo inform da UniFi para roteamento multi-inquilino
Tools

Engenharia reversa do protocolo inform da UniFi para roteamento multi-inquilino

O protocolo inform UniFi envia dados do dispositivo para os controladores via HTTP POST na porta 8080 a cada 10 segundos. Os primeiros 40 bytes de cada pacote contêm endereços MAC do dispositivo não criptografados, permitindo o roteamento sem descriptografia.

OpenClawRadar
TruthGuard: Ganchos de Script Shell que Detectam Mentiras de Agentes de IA de Programação
Tools

TruthGuard: Ganchos de Script Shell que Detectam Mentiras de Agentes de IA de Programação

TruthGuard é uma ferramenta de código aberto que usa ganchos de script shell para verificar o que Claude Code e Gemini CLI realmente fazem versus o que afirmam. Ele detecta edições fantasmas, mentiras sobre códigos de saída, atalhos perigosos e bloqueia commits quando os testes falham.

OpenClawRadar
TideSurf: Ferramenta de compressão DOM reduz uso de tokens de agentes web em 30 vezes, acelera TTFT em 12 vezes
Tools

TideSurf: Ferramenta de compressão DOM reduz uso de tokens de agentes web em 30 vezes, acelera TTFT em 12 vezes

O TideSurf v0.3 converte o DOM renderizado para um formato compactado semelhante a markdown, reduzindo o consumo de tokens em 32x em páginas do GitHub em comparação com o DOM bruto, enquanto adiciona 18 ferramentas interativas para agentes de LLM.

OpenClawRadar