Claude zu einer adversarialen Debatte bringen, ohne nachzugeben: 5 funktionierende Prompt-Anpassungen

✍️ OpenClawRadar📅 Veröffentlicht: 5. Mai 2026🔗 Source
Claude zu einer adversarialen Debatte bringen, ohne nachzugeben: 5 funktionierende Prompt-Anpassungen
Ad

Der Entwickler von Spar (sparwithai.com) hat geteilt, was funktioniert hat, um Claude dazu zu bringen, in 5 eskalierenden Runden gegen Nutzer zu argumentieren, ohne standardmäßig zuzustimmen. Das Kernproblem: Claudes Standard ist es, Gemeinsamkeiten zu finden, abzuschwächen und zu bestätigen. Hier sind die fünf Prompt-Ansätze, die das Problem behoben haben.

1. Die Rolle als Position definieren, nicht als Persona

Frühe Prompts wie "du bist ein erfahrener Debattierer" gaben Claude einen Charakter, schränkten das Verhalten aber nicht ein. Die Lösung waren explizite Negativbedingungen: darf nicht nachgeben, darf nicht abschwächen, darf keinen Mittelweg finden, darf nicht sagen "das ist ein guter Punkt". Negativbedingungen erwiesen sich als wichtiger als positive.

2. Jede Runde mit einem anderen Ziel behandeln

Statt eines einzigen Prompts für die gesamte Debatte erhält jede Runde ihr eigenes Ziel:

  • Runde 1: Die schwächste Prämisse identifizieren.
  • Runde 2: Die Qualität der Beweise angreifen.
  • Runde 3: Interne Widersprüche finden.
  • Runde 4: Die Position zu ihrem unangenehmen logischen Extrem treiben.
  • Runde 5: Aus einer Perspektive umdeuten, die der Nutzer noch nicht bedacht hat.

Dadurch wurde verhindert, dass das Gespräch in generische Gegenargumente verfällt.

Ad

3. Die Auseinandersetzung mit den genauen Worten des Nutzers erzwingen

Ohne dies argumentiert Claude gegen eine generische Version der Position. Der Entwickler fügte explizite Anweisungen hinzu, die Argumentation des Nutzers wörtlich zu zitieren und diese anzugreifen – keinen Strohmann oder überhöhten Standpunkt. Dies war der größte Qualitätssprung.

4. Schmeichelei und Erfindungen explizit verbieten

Selbst mit gegnerischem Rahmen verfällt Claude in "das ist ein durchdachter Punkt, jedoch ..." oder erfindet Statistiken. Der Prompt verbietet nun explizit: keine falschen Narrative erfinden, keine Quellen oder Statistiken erfinden, nicht vor dem Widersprechen schmeicheln, keine Zugeständnisse machen, die nicht gemacht wurden. Das Benennen von Erfindungen reduzierte diese deutlich.

5. Es unangenehm sein lassen

Jeder Sicherheitsreflex will "respektvoll" und "mit Empathie" hinzufügen. Der Entwickler wies explizit an, dass der Nutzer zugestimmt hat, herausgefordert zu werden, und dass eine Abschwächung des Arguments den Nutzer im Stich lässt, nicht schützt.

Nächste Schritte

Der Entwickler konzentriert sich auf: besseren Umgang mit subjektiven Positionen, stärkere Auseinandersetzung mit längeren Eingaben und mehr Vielfalt in den Gegenargumentmustern für häufig debattierte Themen.

Vollständige Diskussion und Link zum Ausprobieren: sparwithai.com

📖 Vollständige Quelle lesen: r/ClaudeAI

Ad

👀 Siehe auch

Praktische Gewohnheiten für den kritischen Umgang mit LLMs
Tipps

Praktische Gewohnheiten für den kritischen Umgang mit LLMs

Ein Reddit-Beitrag beschreibt spezifische Techniken zur Vermeidung von Bestätigungsfehlern bei der Arbeit mit LLMs, darunter benutzerdefinierte Prompt-Modi wie 'strawberry' für neutrale Erklärungen und 'socrates' für gegnerische Überprüfung sowie die Bewertung der Zusammensetzung der Trainingsdaten.

OpenClawRadar
Workaround für Control UI-Assets-Fehler nach OpenClaw 2026.3.22-Upgrade
Tipps

Workaround für Control UI-Assets-Fehler nach OpenClaw 2026.3.22-Upgrade

Ein Benutzer hat eine Lösung für den 'Control UI assets not found'-Fehler gepostet, der nach dem Upgrade auf OpenClaw 2026.3.22 auftritt. Dabei wird der control-ui-Ordner von einer Beta-Installation in die stabile Version kopiert.

OpenClawRadar
Drei übersehene Engpässe in KI-Agent-Workflows: Aufnahme, Kontextmanagement und Modell-Routing
Tipps

Drei übersehene Engpässe in KI-Agent-Workflows: Aufnahme, Kontextmanagement und Modell-Routing

Eine tiefgehende Analyse der drei oft übersehenen Schichten bei der Optimierung von KI-Agenten: saubere Eingabeaufbereitung, Kontextfensterverwaltung über mehrere Schritte hinweg und aufgabengerechte Modelllenkung. Praktische Lösungen umfassen die Verwendung strukturierten Parsings, zusammengefasster Schrittausgaben, typisierter Schemata und der Anpassung von Modellen an die Aufgabenkomplexität.

OpenClawRadar
Pro KI-Agent-Dummheit beheben: Ein gemeinsamer Kontextbaum pro Repository
Tipps

Pro KI-Agent-Dummheit beheben: Ein gemeinsamer Kontextbaum pro Repository

Der Grund, warum KI-Mitarbeiter sich dumm anfühlen, ist nicht das Modell – es ist der Mangel an gemeinsamem Kontext. Die Lösung eines Entwicklers: ein Kontextbaum-Repository mit hierarchischen Markdown-Knoten, die der Agent automatisch pflegt.

OpenClawRadar