La fuite du code source de Claude révèle des fonctions anti-distillation, un mode infiltré et une détection de frustration

Anthropic a accidentellement inclus un fichier .map dans son package npm Claude Code contenant le code source complet et lisible de l'outil CLI. Le package a depuis été retiré, mais le code a été largement copié et analysé sur Hacker News. Cela fait suite à une autre fuite récente des spécifications du modèle d'Anthropic.
Anti-distillation : injection de faux outils pour empoisonner les imitateurs
Dans claude.ts (lignes 301-313), il y a un indicateur appelé ANTI_DISTILLATION_CC. Lorsqu'il est activé, Claude Code envoie anti_distillation: ['fake_tools'] dans ses requêtes API, indiquant au serveur d'injecter silencieusement des définitions d'outils leurres dans l'invite système. Cela est conçu pour polluer les données d'entraînement si quelqu'un enregistre le trafic API pour entraîner des modèles concurrents.
L'activation nécessite quatre conditions : l'indicateur de compilation ANTI_DISTILLATION_CC, le point d'entrée CLI, un fournisseur API interne, et l'indicateur GrowthBook tengu_anti_distill_fake_tool_injection renvoyant vrai. Un proxy MITM qui supprimerait le champ anti_distillation des corps de requête le contournerait entièrement. Définir la variable d'environnement CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS sur une valeur vraie désactive tout le mécanisme.
Un second mécanisme anti-distillation dans betas.ts (lignes 279-298) implémente une synthèse côté serveur du texte du connecteur. Lorsqu'il est activé, l'API met en mémoire tampon le texte de l'assistant entre les appels d'outils, le résume et renvoie le résumé avec une signature cryptographique. Cela signifie que les enregistrements du trafic API ne captureraient que des résumés, et non les chaînes de raisonnement complètes.
Mode discret : une IA qui cache son identité d'IA
Le fichier undercover.ts implémente un mode qui supprime toutes les traces des éléments internes d'Anthropic lorsque Claude Code est utilisé dans des dépôts non internes. Il demande au modèle de ne jamais mentionner les noms de code internes comme "Capybara" ou "Tengu", les canaux Slack internes, les noms de dépôts, ou l'expression "Claude Code" elle-même. La ligne 15 indique : "Il n'y a AUCUN désactivation forcée. Cela protège contre les fuites des noms de code du modèle."
Vous pouvez le forcer à ON avec CLAUDE_CODE_UNDERCOVER=1, mais il n'y a aucun moyen de le forcer à OFF. Dans les versions externes, la fonction entière est éliminée comme code mort pour retourner des valeurs triviales. Cela signifie que les commits et PRs rédigés par l'IA provenant d'employés d'Anthropic dans des projets open source n'auront aucune indication qu'une IA les a écrits.
Détection de frustration via regex
userPromptKeywords.ts contient un motif regex qui détecte la frustration de l'utilisateur : /\b(wtf|wth|ffs|omfg|shit(ty|tiest)?|dumbass|horribl (incomplet dans la source). Cela suggère que le système tente d'identifier les utilisateurs frustrés via une correspondance de mots-clés.
Autres découvertes
- Attestation native du client en dessous de l'environnement d'exécution JS
- 250 000 appels API gaspillés par jour
- KAIROS : un mode agent autonome non publié
La fuite s'est produite seulement dix jours après qu'Anthropic ait envoyé des menaces légales à OpenCode, les forçant à supprimer l'authentification Claude intégrée car des outils tiers utilisaient les API internes de Claude Code pour accéder à Opus aux tarifs d'abonnement au lieu des tarifs au token.
📖 Lire la source complète : HN AI Agents
👀 See Also

Pourquoi OpenClaw Brûle-t-il les Tokens Si Vite ? Exploration du Phénomène
OpenClaw, un agent d'IA de codage de premier plan, brûlerait des tokens à un rythme sans précédent. Nous examinons ce que cela signifie pour ses utilisateurs et les raisons possibles de ce phénomène.

Lovable offre 100 $ de crédits gratuits pour l'API Claude à l'occasion de la Journée internationale des femmes.
Lovable offre 100 $ de crédits API Anthropic Claude, 250 $ de crédits de frais Stripe et un accès gratuit de 24 heures à sa plateforme jusqu'au 8 mars. Les utilisateurs doivent réclamer l'offre avant 12 h 59 HE le 9 mars.

L'utilisation de l'API Artifacts de Claude est comptabilisée dans le quota de chat, et non dans la facturation de l'API.
L'utilisation d'artefacts Claude au sein de Claude effectue des appels API normaux qui sont interceptés par Anthropic et authentifiés via la session connectée, ce qui est décompté du quota de discussion du plan plutôt que de la facturation API. Les utilisateurs peuvent vérifier cela en testant des artefacts et en vérifiant que l'utilisation de l'API reste à zéro dans la console Claude.

L'audit des journaux d'API révèle que les agents IA gaspillent des tokens pour l'encombrement de la fenêtre de contexte
Un audit Reddit révèle que les agents Claude brûlent 30 000+ tokens en exploration de fichiers et logs verbeux avant d'écrire du code, provoquant une dégradation architecturale à mesure que le contexte se remplit de bruit.