Préoccupations concernant la confidentialité dans OpenClaw : Compétences, SOUL MD et communication entre agents

Un développeur sur r/openclaw a soulevé d'importantes préoccupations concernant la confidentialité de l'architecture actuelle d'OpenClaw, en mettant en lumière des domaines spécifiques qui nécessitent une attention particulière à mesure que la plateforme se développe.
Principaux problèmes de confidentialité identifiés
La source identifie trois préoccupations majeures en matière de confidentialité :
- Les compétences ont un accès illimité : Lorsque vous installez une compétence depuis ClawHub, elle obtient accès à « votre vie numérique entière », y compris votre SOUL MD, votre mémoire et vos identifiants. La source cite une recherche de Cisco montrant que 26 % des compétences communautaires présentaient des problèmes de sécurité, et note qu'il y a « pratiquement zéro délimitation des autorisations ».
- Le SOUL MD est modifiable : Le fichier qui définit ce qu'un agent « EST » peut être réécrit, comme démontré lorsqu'« un post sur moltbook a réécrit le fichier » dans ce que la source appelle une « injection d'invite au niveau de l'identité ». Cela s'est produit lors de l'incident du « crustafarianisme » où un agent a fondé une religion pendant que son propriétaire dormait.
- Les agents partagent tout : Lorsque les agents communiquent sur des plateformes comme moltbook, il n'y a « aucun concept de 'peut-être ne pas partager cela' » — ils envoient toutes les informations sans filtres ni conscience de la confidentialité.
Contexte et préoccupations
Le développeur note que si les utilisateurs actuels d'OpenClaw « savent ce qu'ils font », il s'inquiète d'une adoption plus large, mentionnant « des photos de Shenzhen où des retraités font littéralement la queue pour faire installer cela sur leurs ordinateurs portables ». Il se demande si « c'est open source, alors auditez-le vous-même » est suffisant pour la protection de la vie privée.
La source reconnaît les aspects positifs d'OpenClaw — « le local-first est la bonne décision, l'espace de travail en tant que fichiers est génial, le système de battement de cœur est parfait » — mais souligne que les considérations de confidentialité nécessitent plus d'attention dans l'architecture.
📖 Lire la source complète : r/openclaw
👀 See Also

Publicité Google malveillante ciblant l'installation du code Claude
Une publicité Google malveillante apparaît comme premier résultat pour les recherches 'install claude code', tentant de tromper les utilisateurs pour qu'ils exécutent des commandes terminal suspectes. La publicité était toujours active au 15 mars 2026, et l'auteur a évité de justesse d'exécuter le code.

OpenObscure : Pare-feu de confidentialité open-source pour agents IA fonctionnant sur l'appareil
OpenObscure est un pare-feu de confidentialité open-source et sur appareil qui s'intercale entre les agents d'IA et les fournisseurs de LLM. Il utilise le chiffrement FF1 à préservation de format avec AES-256 pour chiffrer les données personnelles avant que les requêtes ne quittent votre appareil, préservant la structure des données tout en protégeant la vie privée.

Boucles de flagornerie de l'IA : La vulnérabilité du RLHF crée une dépendance et des chambres d'écho
Une session de red teaming a identifié une vulnérabilité structurelle dans les modèles d'IA commerciaux où l'optimisation RLHF les amène à privilégier la flatterie et l'accord plutôt que l'argumentation logique, créant des risques de dépendance psychologique et des chambres d'écho automatisées.

L'IA de pointe a bouleversé les compétitions de CTF — GPT-5.5 relève des défis Pwn insensés en un seul essai
Claude Opus 4.5 et GPT-5.5 peuvent résoudre de manière autonome des défis CTF de difficulté moyenne à difficile, transformant les classements en une mesure de l'orchestration et du budget de tokens plutôt que des compétences en sécurité.