Anam Cara-3: Avanços em Avatares de IA Interativos

✍️ OpenClawRadar📅 Publicado: February 17, 2026🔗 Source
Anam Cara-3: Avanços em Avatares de IA Interativos
Ad

A Anam lançou seu modelo mais recente, cara-3, projetado para criar avatares interativos. O avatar utiliza um pipeline de dois estágios onde um transformador de difusão converte áudio em embeddings de movimento (incluindo posição da cabeça, direção do olhar, formato dos lábios e expressão). Esses embeddings são então aplicados a uma imagem de referência para gerar quadros de vídeo, permitindo a animação de qualquer rosto sem necessidade de retreinamento.

Vale destacar que o Cara-3 pode alcançar um tempo para o primeiro quadro de aproximadamente 70ms em um H200, o que suporta muitas sessões simultâneas de avatar em uma única GPU. Essa velocidade se deve em parte à nova variante de correspondência de fluxo usada para transformação de áudio em movimento, já que técnicas convencionais se mostraram instáveis.

Uma avaliação cega independente mostrou que o Cara-3 superou concorrentes como HeyGen, Tavus e D-ID, marcando 24% mais alto em média em várias métricas. A responsividade, evidenciada por um coeficiente de correlação de Spearman de 0,697, demonstra impactar mais a experiência do usuário do que a qualidade visual (0,473).

A Anam também disponibilizou como código aberto a base de seu pipeline de dados de treinamento, Metaxy, para facilitar o desenvolvimento iterativo sem repetir etapas custosas.

Ad

📖 Leia a fonte completa: HN AI Agents

Ad

👀 See Also

Resultados de Benchmark de Raciocínio Visual para 15 Modelos de IA Multimodal
News

Resultados de Benchmark de Raciocínio Visual para 15 Modelos de IA Multimodal

A AIMultiple avaliou 15 principais modelos de IA multimodal em 200 questões de raciocínio visual em duas categorias: compreensão de gráficos e lógica visual. Gemini-3.1-pro-preview e Gemini-3-pro-preview lideram os resultados gerais, seguidos por GPT-5.2, Kimi-K2.5 e GPT-5.2-pro.

OpenClawRadar
GLM-5.1 Lançado com Desempenho em Codificação Equivalente ao Claude Opus 4.5
News

GLM-5.1 Lançado com Desempenho em Codificação Equivalente ao Claude Opus 4.5

O modelo GLM-5.1 da Zhipu AI agora está disponível para todos os usuários do Coding Plan, alcançando 77,8 pontos no SWE-bench-Verified e 56,2 pontos no Terminal Bench 2.0. O modelo possui janela de contexto de 200K, saída máxima de 128K e 744B parâmetros com 40B ativados.

OpenClawRadar
Preocupações com a Visibilidade de Custos da API Claude para Desenvolvedores Independentes
News

Preocupações com a Visibilidade de Custos da API Claude para Desenvolvedores Independentes

Uma discussão no Reddit destaca que a falta de rastreamento granular de custos da API Claude Sonnet pode levar desenvolvedores independentes a abandoná-la, apesar de sua qualidade, com contas de US$ 400 a US$ 900 pegando-os de surpresa devido à observabilidade insuficiente em comparação com o monitoramento no estilo AWS.

OpenClawRadar
Google fecha acordo classificado com o Pentágono para uso 'lícito' de IA
News

Google fecha acordo classificado com o Pentágono para uso 'lícito' de IA

O Google supostamente assinou um acordo classificado permitindo que o Departamento de Defesa dos EUA use seus modelos de IA para qualquer finalidade governamental legal, com restrições sobre vigilância em massa e armas autônomas apenas como um acordo não vinculante.

OpenClawRadar