HC1 de Taalas: Acelerando Inferência de IA com Silício Personalizado

A Taalas lançou uma nova plataforma, a HC1, projetada especificamente para inferência de IA usando silício personalizado. Essa abordagem transforma modelos de IA em hardware dedicado, otimizando significativamente o desempenho e o custo. A plataforma HC1 é projetada em torno de três princípios fundamentais: especialização total, fusão de armazenamento e computação e simplificação radical.
O primeiro produto revelado sob essa plataforma é uma implementação em hardware fixo do modelo Llama 3.1 8B. Os benchmarks de desempenho demonstram melhorias de velocidade de quase 10 vezes, com 17.000 tokens/segundo por usuário, em comparação com os sistemas atuais de inferência de IA. Além disso, a solução é 20 vezes mais barata e consome 10 vezes menos energia.
As principais inovações envolvem eliminar a fronteira tradicional entre memória e computação. Isso é alcançado integrando memória e computação em um único chip, aproximando a densidade da DRAM para melhorar a eficiência operacional e a relação custo-benefício.
A implementação do Llama 3.1 8B também oferece flexibilidade com tamanhos de janela de contexto ajustáveis e a opção de ajuste fino por meio de adaptadores de baixo posto. Este produto visa desenvolvedores que buscam soluções de IA eficientes e econômicas, especialmente em ambientes onde a latência e o consumo de energia são restrições críticas.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Modelos de LLM de código aberto superam o Claude Opus 4.6 na geração de estratégias de negociação com custo mais baixo
Um usuário do Reddit testou 10 LLMs na geração de estratégias de trading, descobrindo que modelos de código aberto superaram o Claude Opus 4.6, apesar de serem 10 vezes mais baratos. Minimax 2.5 e Gemini 3.1 lideraram o ranking.

Resultados da Avaliação Cega de Gemma 4 vs Qwen 3.5 com Claude Opus como Juiz
Uma avaliação cega de 30 perguntas comparou o Gemma 4 31B, o Gemma 4 26B-A4B e o Qwen 3.5 27B usando o Claude Opus 4.6 como juiz. O Qwen 3.5 27B venceu 46,7% dos confrontos, mas teve pontuações médias mais baixas devido a três respostas com pontuação zero.

Claude Code v2.1.133: reversão de worktree.baseRef, caminhos de sandbox, correção de proxy para MCP OAuth
Anthropic lança a versão v2.1.133 do Claude Code CLI com uma nova configuração worktree.baseRef padrão para fresh (ramo a partir de origin/default), sandbox.bwrapPath e sandbox.socatPath para binários customizados de bubblewrap/socat, correção de proxy/mTLS para o fluxo OAuth do MCP e várias correções de bugs.

Mistral AI adquire Emmi AI para construir um stack de IA para engenharia industrial
Mistral AI adquire Emmi AI, integrando modelos de Física AI para simulação industrial em energia, automotivo, semicondutores e aeroespacial. A equipe combinada de mais de 30 pesquisadores abrirá um novo escritório em Linz.