Anthropic streicht wichtige Sicherheitsverpflichtung aus Responsible-Scaling-Policy

Anthropic hat die Kernverpflichtung aus seiner Flaggschiff-Richtlinie für verantwortungsvolle Skalierung (Responsible Scaling Policy, RSP) entfernt, wie ein TIME-Bericht darlegt. Das Unternehmen hatte sich 2023 verpflichtet, niemals ein KI-System zu trainieren, es sei denn, es könnte im Voraus garantieren, dass seine Sicherheitsmaßnahmen angemessen seien.
Details zur Richtlinienänderung
Das Unternehmen verwirft das Versprechen, keine KI-Modelle zu veröffentlichen, wenn Anthropic nicht im Voraus eine ordnungsgemäße Risikominderung garantieren kann. Dies war die zentrale Säule ihrer Responsible Scaling Policy, die Unternehmensführer jahrelang als Beleg dafür gepriesen hatten, dass sie Marktanreizen widerstehen würden, potenziell gefährliche Technologie zu überstürzen.
Gründe für die Änderung
Anthropics Chief Science Officer Jared Kaplan sagte gegenüber TIME: "Wir hatten das Gefühl, dass es niemandem wirklich helfen würde, wenn wir das Training von KI-Modellen einstellen. Wir empfanden es angesichts der rasanten Entwicklung der KI nicht wirklich als sinnvoll, einseitige Verpflichtungen einzugehen … wenn die Konkurrenz voranstürmt."
Das Unternehmen hat sich als das sicherheitsbewussteste der führenden KI-Forschungslabore positioniert, was diese Richtlinienänderung für Entwickler, die KI-Sicherheitspraktiken verfolgen, bedeutsam macht. Die Entscheidung markiert eine Abkehr von ihrer früheren Haltung, Sicherheitsgarantien über die Entwicklungsgeschwindigkeit zu stellen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Claude Code v2.1.121: MCP alwaysLoad, Plugin-Prune, Terminal-Scroll-Fixes und Patches für Speicherlecks
Claude Code v2.1.121 fügt alwaysLoad für MCP-Server, einen Plugin-Prune-Befehl, Type-to-Filter /skills, PostToolUse-Ausgabeersetzung, Terminal-Scroll- und URL-Fixes sowie mehrere Speicherleckbehebungen hinzu, darunter multi-GB RSS-Wachstum bei vielen Bildern.

Meta veröffentlicht BOxCrete KI-Modell für Betonmischungsentwurf
Meta hat Bayesian Optimization for Concrete (BOxCrete) veröffentlicht, ein Open-Source-KI-Modell zur Gestaltung nachhaltiger Betonmischungen unter Verwendung von in den USA produzierten Materialien. Das Modell verbessert frühere Versionen durch bessere Robustheit gegenüber Störungen und verbesserte Vorhersagefähigkeiten für das Setzmaß.

OpenClaw-Agent-Ausgabenmuster und fehlende Ausgabenobergrenzen
Ein Entwickler verfolgte die Ausgaben von OpenClaw-Agenten über zwei Monate und stellte fest, dass die meisten Agenten im Durchschnitt 40–80 US-Dollar pro Monat an API- und Dienstgebühren verursachen, wenn sie unbeaufsichtigt bleiben, wobei die Spitzen an Wochenenden und über Nacht auftreten. Das Standardverhalten ist unbegrenzt, ohne integrierte Ausgabenobergrenze.

Silicon-Valley-Entwickler berichten von intensiven Claude-AI-Nutzungsmustern und Infrastrukturbelastungen.
Ein leitender KI-Ingenieur bei Meta gibt 2.000 US-Dollar pro Monat für Claude Code-Tokens aus, betreibt gleichzeitig 2+ Agenten und hat eine VS Code-Erweiterung entwickelt, die automatisch ein Obsidian-Wissensnetz aus Claude-Konversationen generiert. Die Infrastruktur sei angeblich 'komplett zerstört', weil man von Claude generierten Code ohne Überprüfung ausliefert.