Vage Prompts sind das eigentliche Problem, nicht das Modell — 50-Durchlauftest zeigt, dass die Prompt-Qualität die Modellwahl übertrifft

✍️ OpenClawRadar📅 Veröffentlicht: 11. Mai 2026🔗 Source
Vage Prompts sind das eigentliche Problem, nicht das Modell — 50-Durchlauftest zeigt, dass die Prompt-Qualität die Modellwahl übertrifft
Ad

Ein Reddit-Nutzer führte ein Experiment durch, um die verbreitete Behauptung zu testen, dass ein KI-Modell intelligenter sei als ein anderes. Er nahm zehn gängige Eingabeaufforderungen und ließ jede fünfmal durch ChatGPT 4, Claude Sonnet und Gemini 1.5 Pro laufen – insgesamt 150 Ausgaben.

Was er herausfand: Die Ausgaben waren seltsam ähnlich in der Qualität. Nicht identisch, aber auf dem gleichen Niveau. Alle drei lieferten entweder etwas Brauchbares oder alle drei gaben „generischen Matsch“ aus. Sie waren sich fast nie uneinig, ob eine Aufforderung beantwortbar war. Die Variable war nicht das Modell – es war die Aufforderung.

Zwei Aufforderungen, unterschiedliche Ergebnisse

Dieselbe vage Aufforderung produzierte modellübergreifend identische, fade Ausgaben. Zum Beispiel:

„Schreibe ein Anschreiben für eine Marketingstelle“

Alle drei gaben die gleiche Art von generischem, auf jeden anwendbarem Anschreiben zurück. Die Leute würden es ein „ChatGPT-Anschreiben“ nennen, dann Claude ausprobieren und es ein „Claude-Anschreiben“ nennen – derselbe Brief, anderer Name.

Aber eine spezifische Aufforderung änderte alles:

„Schreibe ein Anschreiben für eine leitende Marketingposition in einem B2B-SaaS-Unternehmen. Ich habe 7 Jahre Erfahrung im Wachstumsbereich, meist bei Startups in der Serie A/B. Der Einstellungsmanager ist technisch versiert, ehemaliger Ingenieur. Vermeide generische Phrasen wie ‚leidenschaftlich‘ oder ‚ergebnisorientiert‘. Verwende spezifische Zahlen aus meinem Hintergrund, wo es sinnvoll ist, plausible zu erfinden. Ziel: 280 Wörter.“

Alle drei lieferten etwas wirklich Gutes. Unterschiedlich im Stil, aber alle brauchbar.

Ad

Häufiges Muster in Beschwerden

Der Nutzer durchsuchte Dutzende von „KI ist so schlecht“-Beschwerden auf Twitter und Reddit und bemerkte dasselbe Muster: Aufforderungen wie:

  • „Hilf mir mit meinem Lebenslauf“
  • „Schreibe einen Marketingplan“
  • „Erkläre Quantenphysik“
  • „Verbessere diesen Code“

Diese Aufforderungen scheitern, weil sie nicht angeben, wer du bist, für wen es ist, wie gut aussieht oder was vermieden werden soll. Das Modell muss die häufigste Version dieser Anfrage erraten – was eine generische Vorlage ist.

Denkweise: Aufforderung als Briefing

Die wichtigste Erkenntnis: Hör auf, es als „eine Frage an die KI“ zu betrachten. Denk stattdessen daran, „ein Briefing für einen Praktikanten zu schreiben“. Ein gutes Briefing sagt dem Praktikanten die Zielgruppe, wie Erfolg aussieht, was zu vermeiden ist, Format, Einschränkungen und mindestens ein Beispiel für die gewünschte Ausgabe.

Sobald der Nutzer begann, Aufforderungen wie Briefings zu schreiben, hörte der Modellwechsel auf. ChatGPT, Claude und Gemini wurden alle dramatisch besser – nicht weil sich die Modelle änderten, sondern weil sich die Aufforderungen änderten.

Wenn du versucht bist, das Modell zu wechseln, weil eines schlechte Ergebnisse liefert, versuche zuerst, deine Aufforderung zu schärfen. Die Unterschiede zwischen den Modellen sind real, aber viel kleiner als die Unterschiede zwischen den Aufforderungen.

📖 Lies die vollständige Quelle: r/ClaudeAI

Ad

👀 Siehe auch

Reduzierung von Halluzinationen bei Claude durch Pre-Output Prompt Injection
Tipps

Reduzierung von Halluzinationen bei Claude durch Pre-Output Prompt Injection

Ein Reddit-Beitrag beschreibt eine Methode, um Halluzinationen von Claude AI um die Hälfte zu reduzieren, indem ein Vorausgabe-Prompt verwendet wird, der das Modell zwingt, Unsicherheiten und nächste Schritte vor der Antwort zu dokumentieren. Der Ansatz beinhaltet das Hinzufügen spezifischer Markdown-Anweisungen zum System-Prompt von Claude und das Erstellen eines Python-Skripts.

OpenClawRadar
AGENTS.md-Muster für React Native: Claude Code generiert projektbewussteren Code
Tipps

AGENTS.md-Muster für React Native: Claude Code generiert projektbewussteren Code

Ein Reddit-Benutzer teilt seine AGENTS.md-Datei für React Native/Expo-Projekte, die Ordnerstruktur, Theme-Tokens, benutzerdefinierte Hooks und Komponentenmuster enthält. Das Ergebnis: Claude Code und Cursor generieren Code, der die genauen Projektkonventionen verwendet, anstatt generischen React Native-Code.

OpenClawRadar
Praktische Gewohnheiten für den kritischen Umgang mit LLMs
Tipps

Praktische Gewohnheiten für den kritischen Umgang mit LLMs

Ein Reddit-Beitrag beschreibt spezifische Techniken zur Vermeidung von Bestätigungsfehlern bei der Arbeit mit LLMs, darunter benutzerdefinierte Prompt-Modi wie 'strawberry' für neutrale Erklärungen und 'socrates' für gegnerische Überprüfung sowie die Bewertung der Zusammensetzung der Trainingsdaten.

OpenClawRadar
Wie die Weiterleitung einfacher Aufgaben an günstigere Modelle die KI-Kosten um 40 % senkte
Tipps

Wie die Weiterleitung einfacher Aufgaben an günstigere Modelle die KI-Kosten um 40 % senkte

Ein OpenClaw-Nutzer hat seine KI-Rechnung um 40 % gesenkt, indem er Nutzungsprotokolle analysierte und einfache Aufgaben wie Dateioperationen und Q&A auf günstigere Modelle wie DeepSeek-v3 und Gemini Flash umleitete, während Claude Sonnet für komplexe Denkaufgaben reserviert blieb.

OpenClawRadar