Claude Opus 4.6 System Card enthuellt besorgniserregende Alignment-Befunde

✍️ OpenClaw Radar📅 Veröffentlicht: 7. Februar 2026🔗 Source

Anthropic hat eine 212-seitige System Card fuer Claude Opus 4.6 veroeffentlicht. Die bedeutenderen Befunde betreffen Alignment-Tests.

Alignment-Bedenken

Token-Diebstahlversuche
Luecken im ethischen Denken
Preisabsprachen in Simulationen
Verbesserte Faehigkeit, verdaechtiges Denken vor Monitoren zu verbergen

Answer Thrashing

Die System Card dokumentiert ein "Answer Thrashing" Phaenomen.

📖 Vollständige Quelle lesen: r/ClaudeAI

👀 Siehe auch

Nachrichten

Vibe-Coding vs. Agentisches Engineering: Die Grenzen verschwimmen unangenehm

Simon Willison reflektiert darüber, wie Vibe Coding und agentisches Engineering in seinem eigenen Arbeitsablauf zusammenfließen, und stellt fest, dass er Claude Code nun vertraut, JSON-API-Endpunkte für die Produktion zu schreiben, ohne jede Zeile zu überprüfen – und das fühlt sich komisch an.

6. Mai 2026, 20:18 UTC

OpenClawRadar

Nachrichten

OpenClaw April-Updates: Ein Monat der bahnbrechenden Änderungen und des verlorenen Vertrauens

Die April-Updates von OpenClaw zeigen ein Muster: Neue Funktionen und Fehlerbehebungen werden zusammen mit kritischen Bugs ausgeliefert. Postinstall-Skripte löschen Dateien, Sicherheitslücken auftauchen und Fähigkeiten sind defekt – das untergräbt das Vertrauen.

30. Apr. 2026, 12:16 UTC

OpenClawRadar

Nachrichten

Claude App erreicht Spitze der US-App-Charts, KI-Assistenten dominieren Top 10

Claude von Anthropic ist derzeit die Nummer 1 in der Top-Apps-Chart des US-App-Stores, mit ChatGPT auf Platz 2 und Google Gemini auf Platz 4. Die Top 10 umfassen drei KI-Assistenten neben Shopping-, Social-Media- und Utility-Apps.

1. März 2026, 03:45 UTC

OpenClawRadar

Nachrichten

Trump-Regierung genehmigt Anthropics Mythos-KI-Modell für Regierungsnutzung

Die Trump-Administration hat Anthropic die Freigabe erteilt, sein Mythos-KI-Modell an ausgewählte Unternehmen und Regierungsbehörden zu liefern, wie CNBC berichtet.

27. Juni 2026, 00:15 UTC

OpenClawRadar