Hy3 LLM lidera classificações do OpenRouter: modelo mais barato ou algo mais?

✍️ OpenClawRadar📅 Publicado: May 30, 2026🔗 Source
Hy3 LLM lidera classificações do OpenRouter: modelo mais barato ou algo mais?
Ad

Um misterioso LLM chamado Hy3 preview disparou para o topo do ranking de modelos de IA do OpenRouter, superando modelos consagrados como Claude Opus 4.7 e DeepSeek V4 Flash em mais de 50% no uso de tokens. O modelo, uma versão open-source da gigante chinesa Tencent, está disponível no OpenRouter por $0,066/1M tokens de entrada, tornando-se o modelo grande mais barato da plataforma — ainda mais barato que o DeepSeek V4 Flash, que custa $0,10/1M tokens de entrada.

No entanto, a qualidade do modelo não acompanha sua popularidade. O repositório da Tencent no Hugging Face mostra resultados de benchmark surpreendentemente honestos que não são favoráveis ao Hy3 em comparação com outros modelos open-source chineses. Testes realizados pelo autor sugerem que a qualidade do modelo está no mesmo nível de outros modelos chineses, mas não se aproxima do Claude Opus 4.7 ou GPT 5.5.

Os dados do OpenRouter revelam várias peculiaridades:

  • Pico de uso: Hy3 preview não tinha uso antes de 8 de maio de 2026, quando passou de um SKU gratuito para pago. Desde então, o uso tem sido constante, indicando adoção orgânica.
  • Uso mínimo por aplicativos: Os 5 principais aplicativos respondem por <1% de toda a atividade do Hy3. Isso descarta a possibilidade de um único aplicativo ter trocado o modelo padrão (como aconteceu com Grok Code Fast 1 anteriormente).
  • 98% tokens de entrada, 2% de saída — uma proporção extrema que sugere uso intenso em tarefas de recuperação ou pré-processamento, e não em loops de codificação agentivos.
  • Único provedor: Hy3 preview está disponível apenas via SiliconFlow, um provedor sediado em Singapura, que viu um pico massivo de uso coincidindo com o Hy3.

Quando o Hy3 passou de gratuito para pago, o uso não caiu significativamente, sugerindo que os usuários estão dispostos a pagar apesar da qualidade inferior do modelo — provavelmente porque continua sendo a opção mais barata no OpenRouter. O autor pergunta: o Hy3 preview é realmente o LLM mais barato apoiado por uma grande empresa no OpenRouter?

Ad

Desenvolvedores que usam agentes de codificação com IA devem estar cientes de que a economia de custos pode vir com uma perda de qualidade. Se você está executando inferência em alto volume onde a qualidade da saída é menos crítica (por exemplo, extração de dados, classificação simples), o Hy3 pode ser uma opção viável. Mas para codificação agentiva complexa, espere resultados significativamente piores em comparação com Claude ou GPT.

📖 Leia a fonte completa: HN AI Agents

Ad

👀 See Also

Decaimento de Restrições: Por que Agentes LLM Falham em Código de Backend Estruturado
News

Decaimento de Restrições: Por que Agentes LLM Falham em Código de Backend Estruturado

Nova pesquisa introduz 'decadência de restrições': conforme requisitos estruturais se acumulam, o desempenho do agente LLM cai drasticamente — agentes capazes perdem 30 pontos nas taxas de aprovação, os mais fracos chegam perto de zero. Insights acionáveis para qualquer pessoa que use agentes de IA para codificação.

OpenClawRadar
Resumo Semanal de IA Multimodal: Holotron-12B, Nemotron Omni, GlyphPrinter e Mais
News

Resumo Semanal de IA Multimodal: Holotron-12B, Nemotron Omni, GlyphPrinter e Mais

Os destaques da IA multimodal desta semana incluem o Holotron-12B para tarefas de uso em computador, os modelos NVIDIA Nemotron Omni que integram linguagem+visão+voz, o GlyphPrinter para renderização precisa de texto na geração de imagens, e vários projetos de código aberto para aprimoramento de vídeo, segmentação 3D e sistemas multiagente.

OpenClawRadar
Dois funcionários do Ministério do Interior da África do Sul suspensos por alucinações de IA em documento de política
News

Dois funcionários do Ministério do Interior da África do Sul suspensos por alucinações de IA em documento de política

Dois funcionários foram suspensos após alucinações de IA serem encontradas na lista de referências de um documento revisado sobre cidadania, imigração e proteção de refugiados. O departamento implementará verificações de IA e revisará todos os documentos políticos desde novembro de 2022.

OpenClawRadar
Usuários do OpenClaw relatam altos custos de API devido a prompts vagos; desenvolvedor recomenda fluxos de trabalho estruturados.
News

Usuários do OpenClaw relatam altos custos de API devido a prompts vagos; desenvolvedor recomenda fluxos de trabalho estruturados.

Um usuário do Reddit relata uma conta de US$ 300 da Anthropic do OpenClaw devido a prompts vagos, com a comunidade observando que o orquestrador funciona melhor com intenções claras e fluxos de trabalho estruturados, em vez de atuar como um 'gênio' para pensamentos desejosos.

OpenClawRadar