Réimplémentation de l'IA de la bibliothèque chardet soulève des questions de licence copyleft.

Ce qui s'est passé avec chardet
Dan Blanchard, mainteneur de la bibliothèque Python chardet utilisée par environ 130 millions de projets chaque mois, a publié la version 7.0 avec des changements significatifs. La nouvelle version est 48 fois plus rapide que son prédécesseur, prend en charge plusieurs cœurs et a été entièrement repensée. Claude d'Anthropic est listé comme contributeur à cette version.
La licence est passée de LGPL à MIT. L'approche de Blanchard consistait à fournir uniquement l'API et la suite de tests à Claude, en lui demandant de réimplémenter la bibliothèque à partir de zéro sans regarder directement le code source existant. L'analyse JPlag montre que le code résultant partage moins de 1,3 % de similarité avec toute version antérieure.
Le différend sur les licences
Mark Pilgrim, l'auteur original de la bibliothèque, s'est opposé via un ticket GitHub, arguant que la LGPL exige que les modifications soient distribuées sous la même licence. Pilgrim soutient qu'une réimplémentation produite avec une exposition importante au code source original ne peut pas être considérée comme un effort de « clean-room ».
Deux figures éminentes du logiciel libre ont exprimé des points de vue opposés. Armin Ronacher, créateur de Flask, a salué le changement de licence, déclarant qu'il considère « la GPL comme allant à l'encontre de cet esprit en restreignant ce qui peut être fait avec elle ». Salvatore Sanfilippo (antirez), créateur de Redis, a publié une défense plus large de la réimplémentation par IA basée sur le droit d'auteur et l'histoire du projet GNU.
La question centrale : Légal vs Légitime
L'article soutient que Ronacher et Sanfilippo évitent tous deux la question centrale : est-ce que légal signifie légitime ? L'auteur note que si la réimplémentation assistée par IA occupe le même terrain juridique que les réimplémentations historiques (comme GNU réimplémentant UNIX), il y a une différence directionnelle cruciale.
Lorsque GNU a réimplémenté UNIX, le vecteur allait du logiciel propriétaire au logiciel libre, élargissant les biens communs. Dans le cas de chardet, un logiciel protégé par une licence copyleft (LGPL) a été réimplémenté sous une licence permissive (MIT) qui n'impose aucune obligation aux œuvres dérivées de partager leur code source. L'auteur soutient que cela supprime la clôture qui protégeait les biens communs, puisque les œuvres dérivées basées sur chardet 7.0 n'ont aucune obligation de partager leur code source.
L'article précise que la GPL n'interdit pas de garder le code source privé ou de modifier le logiciel GPL en privé. Ses conditions ne sont déclenchées que par la distribution : si vous distribuez du code modifié ou l'offrez comme service en réseau, vous devez rendre le code source disponible sous les mêmes conditions. Cela crée une condition placée sur le partage plutôt qu'une restriction du partage.
📖 Lire la source complète : HN AI Agents
👀 See Also

Les coûts de l'API OpenClaw atteignent 275 $ en 5,5 heures, soit une projection annuelle de plus de 200 000 $
Un développeur testant OpenClaw avec l'API GPT-5.4 d'OpenAI a dépensé 275 $ entre 11h et 16h30, ce qui équivaut à plus de 200 000 $ par an à ce rythme d'utilisation.

OpenClaw : Expérience décevante ou erreur de configuration ?
Les utilisateurs signalent des problèmes avec OpenClaw qui ne parvient pas à aller au-delà des interactions simples de chatbot malgré une configuration correcte suivant les directives officielles.

Sarvam AI lance des LLM open-source de 30B et 105B avec une infrastructure d'entraînement indienne.
Sarvam AI a rendu open source Sarvam 30B et Sarvam 105B, deux modèles de raisonnement entraînés à partir de zéro en Inde sur des ressources de calcul fournies dans le cadre de la mission IndiaAI. Les deux modèles utilisent une architecture Mixture-of-Experts avec un routage d'experts épars et sont optimisés pour un déploiement efficace sur du matériel allant des GPU aux ordinateurs portables.

Claude Code Génère un Script Python Qui Trouve un Record d'Émirp à 10 069 Chiffres
Le modèle Claude Opus 4.6 d'Anthropic a généré un script Python qui a découvert un emirp (nombre premier réversible) de 10 069 chiffres en environ une journée de temps CPU, battant le précédent record du monde. Le script utilise quatre niveaux de cribles de nombres premiers, y compris un noyau CUDA pour une génération rapide de nombres aléatoires.