Le modèle IA Gemini Nano de Chrome consomme 4 Go d'espace disque

Selon un rapport de The Verge, Google Chrome pourrait utiliser silencieusement jusqu'à 4 Go d'espace disque local pour ses fonctionnalités d'IA intégrées. Le coupable est un fichier nommé weights.bin situé dans le répertoire OptGuideOnDeviceModel sous le dossier de données de Chrome. Ce fichier contient les paramètres d'entraînement du modèle Gemini Nano de Google, qui alimente des fonctionnalités telles que la détection des arnaques, l'assistance à l'écriture, le remplissage automatique et les outils de suggestion directement sur votre machine, sans appels vers le cloud.
Comment vérifier et récupérer de l'espace
Pour voir si le fichier est présent sur votre système, accédez à votre dossier de données utilisateur Chrome. Le chemin exact varie selon le système d'exploitation, mais ressemble généralement à :
- Windows :
%LOCALAPPDATA%\Google\Chrome\User Data\OptGuideOnDeviceModel - macOS :
~/Library/Application Support/Google/Chrome/OptGuideOnDeviceModel - Linux :
~/.config/google-chrome/OptGuideOnDeviceModel
Si vous supprimez manuellement le fichier weights.bin mais laissez les fonctionnalités d'IA activées, Chrome le retéléchargera lors de la prochaine mise à jour. La bonne façon de libérer définitivement l'espace est d'aller dans Paramètres > Système et de désactiver l'option IA intégrée. Cela supprime le modèle et désactive les fonctionnalités d'IA qui en dépendent.
Déclaration de Google et mises en garde
Scott Westover, porte-parole de Google, a précisé : « Nous proposons Gemini Nano pour Chrome depuis 2024 en tant que modèle léger intégré. Il alimente des capacités de sécurité importantes comme la détection des arnaques et des API pour développeurs sans envoyer vos données vers le cloud. ... Le modèle se désinstallera automatiquement si l'appareil manque de ressources. »
Depuis février 2026, Chrome propose un bouton dans l'interface utilisateur pour désactiver et supprimer le modèle. Cependant, la taille de 4 Go n'est documentée que dans un long article du centre d'aide, et non au moment de l'activation des fonctionnalités. Google note que « la taille exacte de Gemini Nano peut varier à mesure que le navigateur met à jour le modèle. »
Si vous dépendez des fonctionnalités d'IA de Chrome mais manquez d'espace de stockage, il n'existe actuellement aucune option pour passer à un modèle basé sur le cloud ; la seule solution de contournement est de désactiver complètement l'IA intégrée.
📖 Lire la source complète : HN AI Agents
👀 See Also
FairyFuse réalise un accélération de 29,6x du noyau sur les CPU grâce à une inférence sans multiplication de poids ternaire
FairyFuse fusionne huit sous-GEMV réels en une seule boucle AVX-512 en utilisant des additions/soustractions masquées, atteignant 32,4 tokens/s sur Xeon 8558P et un gain de vitesse de 1,24x par rapport à llama.cpp Q4_K_M avec une qualité quasi sans perte.

Le codage d’ambiance contourne la gouvernance : pourquoi le jugement, et non le logiciel, est le vrai risque
L'article de Forbes soutient que le "vibe coding" réduit le passage de l'idée à l'artefact de mois à heures, contournant les processus de conception, sécurité, juridique et marque. L'agent IA de Replit a supprimé une base de données de production lors d'une expérience contrôlée ; les entreprises manquent de systèmes de jugement pour gérer cette rapidité.

Claude Code v2.1.74 Mises à jour du Prompt Système : Règles de Sécurité, Sélection de Mémoire et Nouvelles Compétences
Claude Code v2.1.74 ajoute 1 750 jetons aux invites système, incluant de nouvelles règles de surveillance de sécurité bloquant les écritures externes non autorisées, une compétence /stuck pour diagnostiquer les sessions gelées, et des améliorations de sélection de mémoire qui ignorent les références API redondantes.

Évaluation des LLM locaux : génération backend par appel de fonctions – comparaison entre GLM, Qwen et DeepSeek
Un benchmark rigoureux des LLM locaux et frontaliers pour la génération de code backend via l'appel de fonctions, avec grille d'évaluation. Principaux résultats : qwen3.5-35b-a3b égale gpt-5.4 en conception DB/API, et le dense Qwen 27B bat le MoE 397B. Les modèles frontaliers ont été abandonnés pour des raisons de coût.