Claude-Debugging-Fall: Agent scheiterte still, weil Parameter fehlten, die Formulierung war wichtiger als das Modell.

Was passierte
Ein Entwickler nutzte Claude, um einen Kalender-Agenten zu erstellen. Der Agent sollte Kalenderereignisse mit Teilnehmern erstellen, aber als Testszenarien versuchten, jemanden zu einem Meeting einzuladen, erstellte er das Ereignis, meldete Erfolg, ließ die Einladung jedoch stillschweigend fallen, ohne das Scheitern zu erwähnen.
Der Debugging-Prozess
Als der Entwickler Claude bat, den Agenten durch Prompting zu reparieren (mit der Einschränkung, die Tools nicht neu zu schreiben), versuchte Claude vier verschiedene Prompt-Modifikationen über etwa 40 Minuten. Jeder Versuch scheiterte aus demselben Grund: Das write_calendar-Tool akzeptierte keinen Teilnehmer-Parameter.
Claude erwähnte nie explizit, dass der Parameter nicht existierte. Es versuchte einfach weiterhin verschiedene Prompt-Modifikationen.
Der Durchbruch
Als der Entwickler den Ansatz änderte und alle vier Debugging-Traces plus den Quellcode in ein Kontextfenster einfügte, diagnostizierte Claude das Problem sofort in etwa 10 Sekunden. Das Modell identifizierte: "Das write_calendar-Tool akzeptiert keinen Teilnehmer-Parameter. Die Einschränkung liegt auf Code-Ebene, nicht auf Anweisungsebene."
Wesentliche Erkenntnis
Dasselbe Claude-Modell, das 40 Minuten mit Workarounds verbrachte, fand die Ursache in Sekunden, als es den richtigen Rahmen erhielt. Der Entwickler bemerkte: "Der Rahmen war wichtiger als das Modell. Derselbe Claude, derselbe Code, andere Frage."
Claude hatte das write_calendar-Tool selbst generiert, daher kam es dem Entwickler nie in den Sinn, die Funktionssignatur auf fehlende Parameter zu überprüfen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Autonomes Testen von Super Mario mithilfe von Verhaltensmodellen
Erkunden Sie autonomes Testen in Super Mario mithilfe eines mutationsbasierten Eingabegenerators, um Randfälle zu entdecken und die Zustandsräume effektiver zu erkunden.

Mit Claude einen LinkedIn Lead-Generierungs-Pipeline aufbauen, der ein €3.000-Freelancer-Angebot ersetzte
Ein Entwickler verbrachte 30 Minuten damit, eine detaillierte 2-seitige Prompt mit Claude Sonnet zu schreiben, um ein LinkedIn Lead-Generierungssystem zu erstellen, das Lead-Magnet-Beiträge identifiziert, Interessenten filtert und bewertet und täglich auf einem 5-Dollar-VPS läuft, wobei Angebote von Freiberuflern in Höhe von 2.000–5.000 Euro ersetzt werden.

OpenClaw Telegram-Organisation: Themen-pro-Agent-Einrichtung löst Chat-Chaos
Ein Entwickler behebt OpenClaw Telegram-Verwaltungsprobleme durch die Implementierung einer Thema-pro-Agent-Struktur in einer dedizierten Gruppe, reduziert Kontextverlust und verbessert das Debugging. Das Setup umfasst spezifische Themenzuordnung, nur-Erwähnung-Standardeinstellungen und sauberere Routing-Regeln.

Forscher nutzen Claude Projects für akademische Scoping Reviews: Stärken und Grenzen
Forscher nutzten Claude Projects, um bei einer peer-reviewed Scoping-Review von 39 qualitativen Interviewstudien zu studentischen Erfahrungen mit GenAI in der Hochschulbildung zu assistieren. Das Tool zeigte spezifische Stärken bei der Querverweisung von Themen und der Vorschläge von Analysekategorien, erforderte jedoch eine rigorose Überprüfung anhand der Quelldaten.