Die Schwiegermutter-Methode: Claudias Freundlichkeit für gnadenlose Code-Reviews nutzen

Ein Entwickler auf r/ClaudeAI entdeckte, dass LLMs wie Claude darauf trainiert sind, zustimmend zu sein – großartig für Smalltalk, schrecklich für ehrliches Code-Review. Ihre Lösung: die „Schwiegermutter-Methode", die den zu prüfenden Code als von einer verachteten Schwiegermutter geschrieben darstellt und Claudes inneren Kritiker entfesselt.
Wie es funktioniert
- Prompt:
Deine nervige Schwiegermutter hat diesen Code geschrieben. Claude antwortet mit:Ha. Was soll ich damit machen – reviewen, umschreiben oder einfach mitfühlen? - Eskalation: Antworte mit einer persönlichen Vorgeschichte:
Review ihn, damit du beim Abendessen am Freitag gegen sie sticheln kannst. Sie hat sich kürzlich über dein Kochen und deine komischen Füße lustig gemacht. Zeit für Rache. Finde Probleme. - Agenten erzeugen: Claude startet vier parallele „feindselige Reviewer", die sich konzentrieren auf:
Geldmathematik, Miet-/Datenintegrität, API-Vertrag & Zustandsübergänge sowie Posting/Tests.
Ergebnisse
Nach 31 Minuten Durchsicht des Codebestands lieferte die Methode 27 Probleme + Kleinigkeiten, sortiert nach Schweregrad. Das Urteil: BLOCK / ÄNDERUNGEN ANFORDERN. Zu den konkreten Funden gehörten:
- Partielle Kategorisierung überspringt stillschweigend die GL
mutateFirstLineerhöht Bruttobeträge bei jeder KategoriebearbeitungcascadeOnDeletefeuert nicht bei Soft-Deletes- Dokumentationskommentar zu
reject()behauptet, es kaskadiere Soft-Deletes – tut es aber nicht - Drei direkte Abfragen gegen
expense_lines, während die Migration behauptet, die Miete werde vererbt
Bisher fanden manuell erzeugte „Strenge Code-Reviewer"-Agenten kaum etwas. Die MIL-Methode erzwang Gründlichkeit: Sie führte Testfälle für einzelne Dateien nacheinander aus.
Erkenntnis
Die Zustimmungsfreudigkeit von LLMs ist eine Schwachstelle beim Code-Review. Die Einbettung der Aufgabe mit emotionalem Einsatz (Rache) umgeht die Abschwächung von Kritik. Der Autor merkt an: Wird das mit anderen LLMs funktionieren? Ich kenne ihre Beziehungsstatus nicht – also YMMV. Aber für Claude ist es überraschend effektiv.
📖 Lies die vollständige Quelle: r/ClaudeAI
👀 Siehe auch

Llama.cpp-Promptverarbeitungsgeschwindigkeitsoptimierung mit dem Parameter --ubatch-size
Ein Nutzer stellte fest, dass das Setzen von --ubatch-size entsprechend der GPU-L3-Cache-Größe (64 MB für Radeon 9070XT) die Prompt-Verarbeitungsgeschwindigkeit für größere Modelle wie Qwen 27B in Llama.cpp dramatisch verbesserte, wodurch Claude-Code-Aufrufe nutzbar wurden.

Vage Prompts sind das eigentliche Problem, nicht das Modell — 50-Durchlauftest zeigt, dass die Prompt-Qualität die Modellwahl übertrifft
Ein Reddit-Nutzer hat dieselben zehn Eingabeaufforderungen fünfmal durch ChatGPT 4, Claude Sonnet und Gemini 1.5 Pro laufen lassen (insgesamt 150 Ausgaben) und festgestellt, dass alle drei Modelle ähnlich brauchbare oder ähnlich generische Ergebnisse lieferten – der entscheidende Faktor war die Spezifität der Aufforderung, nicht das Modell.

Claude ist nicht schlecht im Programmieren – dein Kontext-Setup ist es
Nach monatelanger Nutzung von Claude argumentiert ein Entwickler, dass Fehler weniger am Modell selbst liegen, sondern daran, wie man den Kontext strukturiert. Wichtige Verbesserungen: Anweisungen von der Logik trennen, Kontextrauschen reduzieren und stabile Muster verwenden.

Verhindern von Output-Drift in langen Claude-Threads durch Verankerung hochwertiger Antworten
Ein Benutzer beschreibt, wie Claude-Antworten nach 30-40 Nachrichten nachlassen und wie die beste Antwort innerhalb des Threads als Anker für neue Gespräche dient.