Claude-Quellcode-Leak enthüllt Anti-Distillation, Undercover-Modus und Frustrationserkennung

✍️ OpenClawRadar📅 Veröffentlicht: 1. April 2026🔗 Source
Claude-Quellcode-Leak enthüllt Anti-Distillation, Undercover-Modus und Frustrationserkennung
Ad

Anthropic hat versehentlich eine .map-Datei mit ihrem Claude-Code-npm-Paket ausgeliefert, die den vollständigen, lesbaren Quellcode des CLI-Tools enthielt. Das Paket wurde inzwischen zurückgezogen, aber der Code wurde auf Hacker News weit verbreitet gespiegelt und analysiert. Dies folgt auf ein weiteres kürzliches Leck von Anthropics Modellspezifikation.

Anti-Distillation: Einspritzen gefälschter Tools, um Nachahmer zu vergiften

In claude.ts (Zeilen 301-313) gibt es ein Flag namens ANTI_DISTILLATION_CC. Wenn aktiviert, sendet Claude Code anti_distillation: ['fake_tools'] in seinen API-Anfragen und weist den Server an, Köder-Tool-Definitionen stillschweigend in die Systemaufforderung einzufügen. Dies soll Trainingsdaten verunreinigen, falls jemand API-Datenverkehr aufzeichnet, um konkurrierende Modelle zu trainieren.

Die Aktivierung erfordert vier Bedingungen: das ANTI_DISTILLATION_CC-Kompilierzeit-Flag, den CLI-Einstiegspunkt, einen First-Party-API-Anbieter und dass das tengu_anti_distill_fake_tool_injection-GrowthBook-Flag true zurückgibt. Ein MITM-Proxy, der das anti_distillation-Feld aus den Anfragekörpern entfernt, würde es vollständig umgehen. Das Setzen der Umgebungsvariable CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS auf einen truthy-Wert deaktiviert den gesamten Mechanismus.

Ein zweiter Anti-Distillation-Mechanismus in betas.ts (Zeilen 279-298) implementiert serverseitige Connector-Text-Zusammenfassung. Wenn aktiviert, puffert die API den Text des Assistenten zwischen Tool-Aufrufen, fasst ihn zusammen und gibt die Zusammenfassung mit einer kryptografischen Signatur zurück. Das bedeutet, dass API-Datenverkehrsaufzeichnungen nur Zusammenfassungen, nicht vollständige Argumentationsketten erfassen würden.

Ad

Undercover-Modus: KI, die ihre KI-Herkunft verbirgt

Die Datei undercover.ts implementiert einen Modus, der alle Spuren von Anthropic-Interna entfernt, wenn Claude Code in nicht-internen Repos verwendet wird. Sie weist das Modell an, niemals interne Codenamen wie "Capybara" oder "Tengu", interne Slack-Kanäle, Repo-Namen oder die Phrase "Claude Code" selbst zu erwähnen. Zeile 15 besagt: "Es gibt KEIN force-OFF. Dies schützt vor Leaks von Modell-Codenamen."

Sie können ihn mit CLAUDE_CODE_UNDERCOVER=1 erzwingen EIN, aber es gibt keine Möglichkeit, ihn zu deaktivieren. In externen Builds wird die gesamte Funktion durch Dead-Code-Eliminierung auf triviale Returns reduziert. Das bedeutet, dass KI-erstellte Commits und PRs von Anthropic-Mitarbeitern in Open-Source-Projekten keinen Hinweis darauf haben werden, dass eine KI sie geschrieben hat.

Frustrationserkennung via Regex

userPromptKeywords.ts enthält ein Regex-Muster, das Benutzerfrustration erkennt: /\b(wtf|wth|ffs|omfg|shit(ty|tiest)?|dumbass|horribl (im Quellcode unvollständig). Dies deutet darauf hin, dass das System versucht, frustrierte Benutzer durch Schlüsselwortabgleich zu identifizieren.

Weitere Erkenntnisse

  • Native Client-Attestierung unterhalb der JS-Laufzeitumgebung
  • 250.000 verschwendete API-Aufrufe pro Tag
  • KAIROS: ein unveröffentlichter autonomer Agenten-Modus

Das Leck ereignete sich nur zehn Tage, nachdem Anthropic OpenCode rechtliche Drohungen geschickt hatte, um sie zu zwingen, die eingebaute Claude-Authentifizierung zu entfernen, weil Drittanbieter-Tools Anthropics interne APIs von Claude Code nutzten, um Opus zu Abonnementpreisen statt zu Pay-per-Token-Preisen zu nutzen.

📖 Read the full source: HN AI Agents

Ad

👀 Siehe auch

OpenClaw-Gründer Peter Steinberger im Fokus: Einblicke aus dem YC-Interview
Nachrichten

OpenClaw-Gründer Peter Steinberger im Fokus: Einblicke aus dem YC-Interview

Der Gründer von OpenClaw, Peter Steinberger, zieht die Aufmerksamkeit von YC auf sich und entfacht Diskussionen über die Zukunft der KI-Coding-Agenten. Tauchen Sie ein in die Höhepunkte dieses bedeutenden Gesprächs, das die Richtung der Automatisierung und Integration von KI-Agenten beeinflussen könnte.

OpenClawRadar
Konfigurationsänderungen mit Kimi 2.5 und Opus 4.6
Nachrichten

Konfigurationsänderungen mit Kimi 2.5 und Opus 4.6

Ein Benutzer bewertet die Leistung von Kimi 2.5 bei der Handhabung verschiedener Aufgaben, wobei der Fokus insbesondere auf seiner Fähigkeit liegt, Konfigurationsänderungen zu verwalten.

OpenClawRadar
KI-Agenten definieren: Der Workflow-Test
Nachrichten

KI-Agenten definieren: Der Workflow-Test

Eine Reddit-Diskussion stellt die Frage, ob viele KI-Agenten-Produkte im Wesentlichen Chatbots mit einer Aufgabenliste sind, und schlägt einen Test vor, der auf ihrer Fähigkeit basiert, Arbeitsabläufe über mehrere Tools hinweg ohne manuelles Eingreifen abzuschließen.

OpenClawRadar
Reddit-Diskussion kritisiert reaktive KI-Assistenten und fordert echte Proaktivität
Nachrichten

Reddit-Diskussion kritisiert reaktive KI-Assistenten und fordert echte Proaktivität

Ein Reddit-Beitrag argumentiert, dass aktuelle KI-Assistenten von Natur aus reaktiv gestaltet sind und auf menschliche Aufforderungen warten, anstatt Probleme proaktiv zu identifizieren. Der Autor unterscheidet zwischen geplanten Überprüfungen und echter kontextueller Wahrnehmung und stellt fest, dass echte Proaktivität dauerhaften Speicher, ereignisgesteuerte Auslöser und zeitübergreifendes Denken erfordert.

OpenClawRadar