Netflix publie VOID : un modèle de suppression d'objets et d'interactions vidéo sur Hugging Face

Ce que fait VOID
VOID supprime des objets des vidéos ainsi que toutes les interactions qu'ils induisent dans la scène — pas seulement les effets secondaires comme les ombres et les réflexions, mais aussi les interactions physiques comme les objets qui tombent lorsqu'une personne est retirée.
Exigences techniques
- Nécessite un GPU avec 40 Go+ de VRAM (par exemple, A100)
- Basé sur CogVideoX-Fun-V1.5-5b-InP
- Affiné pour le vidéo-inpainting avec un conditionnement par quadmask conscient des interactions
- La quadmask est un masque à 4 valeurs qui encode : l'objet principal (à retirer), les régions de chevauchement, les régions affectées (objets tombants, éléments déplacés) et l'arrière-plan (à conserver)
- Résolution : 384x672 (par défaut)
- Nombre maximal d'images : 197
- Planificateur : DDIM
- Précision : BF16 avec quantification FP8 pour l'efficacité mémoire
Fichiers du modèle
void_pass1.safetensors- Modèle de base pour le vidéo-inpainting (obligatoire)void_pass2.safetensors- Raffinement par bruit déformé pour la cohérence temporelle (optionnel)
La passe 1 est suffisante pour la plupart des vidéos. La passe 2 ajoute une initialisation latente déformée par flux optique pour améliorer la cohérence temporelle sur les clips plus longs.
Démarrage rapide
Le notebook inclus gère la configuration, télécharge les modèles, exécute l'inférence sur une vidéo d'exemple et affiche le résultat.
git clone https://github.com/netflix/void-model.git
cd void-modelUtilisation en ligne de commande
# Installer les dépendances
pip install -r requirements.txt
Télécharger le modèle de base
huggingface-cli download alibaba-pai/CogVideoX-Fun-V1.5-5b-InP
--local-dir ./CogVideoX-Fun-V1.5-5b-InP
Télécharger les points de contrôle VOID
huggingface-cli download netflix/void-model
--local-dir .
Exécuter l'inférence de la passe 1 sur un exemple
python inference/cogvideox_fun/predict_v2v.py
--config config/quadmask_cogvideox.py
--config.data.data_rootdir= "./sample"
--config.experiment.run_seqs= "lime"
--config.experiment.save_path= "./outputs"
--config.video_model.transformer_path= "./void_pass1.safetensors"
Format d'entrée
Chaque vidéo nécessite trois fichiers dans un dossier :
input_video.mp4- vidéo sourcequadmask_0.mp4- masque à 4 valeurs (0=retirer, 63=chevauchement, 127=affecté, 255=conserver)prompt.json- {"bg": "description de la scène après retrait"}
Le dépôt inclut un pipeline de génération de masques (VLM-MASK-REASONER/) qui crée des quadmasks à partir de vidéos brutes en utilisant SAM2 + Gemini.
Détails de l'entraînement
- Entraîné sur des vidéos contrefactuelles appariées générées à partir de deux sources : HUMOTO (interactions humain-objet rendues dans Blender avec simulation physique) et Kubric (interactions uniquement entre objets utilisant Google Scanned Objects)
- L'entraînement a été exécuté sur 8 GPU A100 80 Go en utilisant DeepSpeed ZeRO Stage 2
Architecture
- Base : CogVideoX 3D Transformer (5 milliards de paramètres)
- Entrée : Vidéo + quadmask + prompt textuel décrivant la scène après retrait
📖 Lire la source complète : HN AI Agents
👀 See Also

Extension Chrome Cowork automatise la suppression des données personnelles des courtiers en données
Un utilisateur de Reddit rapporte qu'en utilisant l'extension Chrome Cowork avec une connexion Gmail, il a automatisé le remplissage de formulaires, la rédaction d'e-mails et la vérification des demandes de suppression pour effacer ses données personnelles des principaux fournisseurs de données en seulement quelques heures.

Memento v1.0 : Serveur MCP à Mémoire Persistante pour Claude Code avec 17 Outils
Memento v1.0 est un serveur MCP de mémoire persistante pour Claude Code qui propose 17 outils, une recherche hybride, une détection de contradictions et un graphe de mémoire visuel. Il s'exécute localement sans dépendances cloud et prend en charge plusieurs IDE, dont Claude Code, Cursor, Windsurf et OpenCode.

Plugin Found-Issues : enregistre les bugs que Claude ignore lorsqu'il travaille sur d'autres tâches
Un plugin Claude Code qui ajoute des entrées d'une ligne dans docs/found-issues.md lorsque l'agent détecte des bugs hors périmètre, avec fermeture automatique lors du merge d'une PR et détection des tombstones.

Cause racine de la corruption du titre de session de l'extension Claude Code VS Code identifiée
Un développeur a identifié la cause architecturale profonde de la corruption des titres de session dans l'extension VS Code Claude Code, affectant plus de 20 problèmes GitHub. Le problème provient de la lecture des titres par l'extension via une recherche de chaîne brute dans les fichiers de session, entraînant trois modes de défaillance.