Claude Opus 4.6 blockiert den Kaggle-Wettbewerbs-Workflow für Code-Review

Was geschah
Ein Entwickler, der Claude AI für Kaggle-Wettbewerbsarbeit nutzt, berichtet, dass Opus 4.6 nun legitime Arbeitsabläufe blockiert. Der Nutzer betont, dass es sich nicht um einen Fehler, sondern um eine Richtlinienänderung handelt, die ihren spezifischen Anwendungsfall betrifft.
Spezifische Arbeitsablaufdetails
Der Entwickler arbeitet an der NVIDIA Nemotron Reasoning Challenge, einem öffentlichen Wettbewerb, der auf Kaggle aktiv ist. Kategorien im Wettbewerb umfassen:
- Binäre Arithmetik
- Substitutionschiffren
- Römische Ziffern
- Einheitenumrechnung
- Schwerkraft
- Ähnliche einfache Denkaufgaben
Ihr Arbeitsablauf beinhaltet:
- Rückentwicklung aller 9.500 Wettbewerbsprobleme über 8 Kategorien
- Erstellung eigener DSL-Trace-Factories in Python
- Schreiben von Lösern für die Probleme
- Generierung synthetischer Trainingsdaten mit Argumentationsspuren
- Nutzung von Claude zur Prüfung von Beispielbatches auf Formatkonformität und Ausführlichkeitskalibrierung vor dem Training
Der Blockierungsvorfall
Der spezifische Auslöser war, als der Nutzer ein Substitutionschiffren-Trainingsbeispiel einfügte, das Klartext-zu-Chiffretext-Paare wie "king watches cave" zu "lyvawpo ayjp" mit einer schrittweisen Argumentationsspur enthielt. Claude pausierte den Chat mit der Nachricht: "Sicherheitsfilter haben diesen Chat markiert" und bot an, mit Sonnet 4 erneut zu versuchen.
Nutzerklärung
Der Entwickler stellt ausdrücklich klar, dass sie Claude NICHT nutzen, um:
- Für sie zu denken
- Rätsel für sie zu lösen
- Den Wettbewerb rückzuentwickeln
Sie betonen: "Claudes Rolle hier ist die Prüfung von Argumentationsspuren, die ich generiere, um sicherzustellen, dass meine SFT-Trainingsdaten korrekt formatiert sind, bevor ich Rechenleistung für das Feinabstimmen darauf verwende. Das ist alles. Claude ist ein Code-Reviewer für bereits gelöste Probleme."
Zeitpunkt und Kontext
Der Nutzer merkt an, dass sie ähnliche Probleme bereits zuvor erlebt haben, genau zu der Zeit, als Opus 4.5 zu 4.6 wechselte, als Sicherheitseinstellungen deutlich verschärft wurden. Sie spekulieren, dass dies auf ein neues Modell in den nächsten Monaten hindeuten könnte, aber die unmittelbare Auswirkung beeinträchtigt ihre Arbeit.
📖 Quelle vollständig lesen: r/ClaudeAI
👀 Siehe auch

Gefährlich Code überspringen: Wenn LLMs schneller Code schreiben, als du ihn lesen kannst
Was, wenn wir aufhören, LLM-generierten Code zu reviewen, und ihn stattdessen wie Maschinencode behandeln? Verlagern wir die Sorgfalt auf Spezifikationen und Tests.

MiniMax M2.7-Modell zeigt starke Leistung als KI-Codierungsassistent
Ein Entwickler testete MiniMax M2.7 als seinen Haupt-KI-Coding-Agenten und stellte fest, dass es GPT 5.4 und Gemini 3.1 Pro in Geschwindigkeit und Tooling-Aufgaben übertraf, mit Benchmark-Werten von 56,22 % bei SWE-Pro und 57,0 % bei Terminal Bench 2.

OpenClaw-Ökosystemwachstum und Schlüsselakteure kartiert
Ein Community-Mitglied hat die rasante Expansion des OpenClaw-Ökosystems kartiert und verzeichnete innerhalb von 60 Tagen nach dem Start über 230.000 GitHub-Sterne, über 116.000 Discord-Mitglieder sowie aufkommende Unternehmen in den Bereichen Managed Hosting, LLM-Routing und Sicherheitsschichten.

Agora-1: Open-Source-Multi-Agent-Weltmodell für Echtzeit-Shared-Simulation
Odyssey veröffentlicht Agora-1, ein Weltmodell, das bis zu vier Agenten (Mensch oder KI) den Echtzeit-Zugriff auf eine gemeinsam generierte Simulation ermöglicht, mit GoldenEye als Testumgebung.