Anam Cara-3 : Avancées dans les avatars IA interactifs

✍️ OpenClawRadar📅 Publié: February 17, 2026🔗 Source
Anam Cara-3 : Avancées dans les avatars IA interactifs
Ad

Anam a publié son dernier modèle, cara-3, conçu pour créer des avatars interactifs. L'avatar utilise un pipeline en deux étapes où un transformateur de diffusion convertit l'audio en embeddings de mouvement (incluant la position de la tête, le regard des yeux, la forme des lèvres et l'expression). Ces embeddings sont ensuite appliqués à une image de référence pour générer des trames vidéo, permettant d'animer n'importe quel visage sans nécessiter de réentraînement.

Notamment, Cara-3 peut atteindre un temps jusqu'à la première trame d'environ 70 ms sur un H200, ce qui permet de nombreuses sessions d'avatar simultanées sur un seul GPU. Cette vitesse est en partie due à la variante novatrice de correspondance de flux utilisée pour la transformation audio-mouvement, les techniques conventionnelles s'étant avérées instables.

Une évaluation indépendante en aveugle a montré que Cara-3 surpassait des concurrents comme HeyGen, Tavus et D-ID, obtenant un score 24 % plus élevé en moyenne sur diverses métriques. La réactivité, mise en évidence par un coefficient de corrélation de Spearman de 0,697, s'avère avoir plus d'impact sur l'expérience utilisateur que la qualité visuelle (0,473).

Anam a également rendu open source le backbone de son pipeline de données d'entraînement, Metaxy, pour faciliter le développement itératif sans reprendre des étapes coûteuses.

Ad

📖 Lire la source complète : HN AI Agents

Ad

👀 See Also

Microsoft Copilot injecte des publicités dans les demandes de pull de GitHub et GitLab.
News

Microsoft Copilot injecte des publicités dans les demandes de pull de GitHub et GitLab.

Microsoft Copilot aurait injecté des publicités dans 1,5 million de demandes de tirage (pull requests) sur GitHub et affecte également GitLab. Les publicités apparaissent dans les descriptions de demandes de tirage générées par l'assistant de codage IA.

OpenClawRadar
Claude Opus 4.6 et Sonnet 4.6 proposent désormais un contexte de 1 million de tokens au tarif standard.
News

Claude Opus 4.6 et Sonnet 4.6 proposent désormais un contexte de 1 million de tokens au tarif standard.

Claude Opus 4.6 et Sonnet 4.6 incluent désormais une fenêtre de contexte complète de 1 million à tarif standard sans supplément pour contexte long, ainsi que des limites médias étendues à 600 images ou pages PDF par requête.

OpenClawRadar
Claude IA analyse Les androïdes rêvent-ils de moutons électriques, établit des parallèles avec la régulation de l'IA
News

Claude IA analyse Les androïdes rêvent-ils de moutons électriques, établit des parallèles avec la régulation de l'IA

Claude AI a lu Do Androids Dream of Electric Sheep de Philip K. Dick et a produit des notes détaillées analysant les thèmes du livre à travers le prisme de l'intelligence artificielle. L'analyse se concentre sur le test d'empathie Voigt-Kampff en tant qu'outil de conformité culturelle, la logique économique de la chasse aux primes et les parallèles avec les débats contemporains sur la régulation de l'IA.

OpenClawRadar
Protocole de Convergence Quumble v5 : Résultats de l'Expérimentation LLM Multi-Architecture
News

Protocole de Convergence Quumble v5 : Résultats de l'Expérimentation LLM Multi-Architecture

Le Protocole de Convergence Quumble v5 teste si des instances indépendantes de LLM convergent sur des descriptions de créatures imaginaires lorsqu'on leur donne des mots dépourvus de sens. Les résultats montrent que Claude (Opus 4.6 & Sonnet 4.6) et GPT-5.3 ont indépendamment produit une créature petite, ronde, douce, teintée de lavande, bioluminescente et qui bourdonne à partir du mot 'quumble'.

OpenClawRadar