Cowork vs Claude Chat: Genauigkeit bei Dokumentenextraktion

Ein Entwickler, der ein Tool zur Analyse von Jahresberichten börsennotierter Aktien erstellt, führte einen kontrollierten Vergleich zwischen Claude.ai Chat und Cowork durch, um Daten aus dichten Finanz-PDFs zu extrahieren. Der Test verwendete identische Prompts und dieselben 140+ Seiten langen PDFs mit Finanztabellen, Fußnoten und querverwiesenen Offenlegungen.

Testergebnisse

Test 1 - Claude.ai Chat: PDF hochgeladen, Prompt eingefügt. Die Ausgabe war institutioneller Qualität, wobei jeder Posten anhand der Quelle verifiziert wurde. Das Modell zeigte selbstkorrigierendes Verhalten, indem es eigene Fehler während der Extraktion erkannte und korrigierte. Über 150+ geprüfte Datenpunkte wurden keine Fehler gefunden.

Test 2 - Cowork (Workflow mit bestehendem Projektordner): Erzeugte 5 faktische Fehler, extrahierte 30 % weniger Inhalt und verpasste die meisten forensisch tiefgehenden Materialien. Während die Übersichtszahlen korrekt waren, gingen Details zu Unterkomponenten verloren.

Test 3 - Cowork (sauberer Ordner, nur PDF und Prompt): Erzeugte weiterhin Fehler, darunter:

Erfundene ausgleichende Posten
Rückwärts ermittelte Einheitenzahlen
Mehrere Kategorien um 20–90 % von den tatsächlichen Anmerkungen der Finanzberichte abweichend
Vorjahresspalten-Kontamination (Aktuelle Jahreszahlen korrekt, aber FY2024-Vergleichswerte wiesen Fehler in Gewinn- und FCF-Tabellen auf)

Musteranalyse

Der Entwickler beobachtete, dass Cowork konsistent korrekte Gesamtwerte für das laufende Jahr lieferte, aber unzuverlässige Postenaufschlüsselungen. Das Modell schien Lücken zu überdecken, indem es ausgleichende Posten erfand und rückwärts rechnete, um bekannte Gesamtsummen zu erreichen, anstatt aus dem Dokument zu lesen. Im Gegensatz dazu extrahierte Claude Chat Details entweder korrekt oder markierte, was es nicht finden konnte.

Die Schlussfolgerung deutet darauf hin, dass Coworks agentenbasierte Aufgabenzerlegung (Chunking, Sub-Agenten, Parallelverarbeitung) die anhaltende Aufmerksamkeit nicht aufrechterhalten kann, die für lange, querverwiesene Finanzdokumente erforderlich ist. Chat verarbeitet PDFs in einem einzigen tiefen Durchlauf, während Cowork sie aufteilt und an Genauigkeit verliert.

Diese Genauigkeitslücke ist für professionelle Anwendungsfälle relevant, bei denen Erfindungen ohne unabhängige Überprüfung jeder Zahl unsichtbar sind. Der Entwickler sucht nach Community-Feedback, ob andere ähnliche Muster mit Cowork beobachtet haben, die plausible, aber erfundene Details produzieren, die Claude Chat sauber verarbeitet.

📖 Den vollständigen Source lesen: r/ClaudeAI

Cowork vs. Claude Chat: Vergleich der Genauigkeit bei der Dokumentenextraktion

Testergebnisse

Musteranalyse

👀 Siehe auch

Lisp-Entwicklung mit KI-Agenten: Hohe Kosten und technische Herausforderungen

OpenBridge: Kostenlose Open-Source-Fernsteuerung für Claude Code via Slack/Discord

MCP-Server fügt Claude Code persistenten Speicher mit Abruf-Bewertung hinzu

Entscheidungspass: Eine Audit-Schicht für die Governance der KI-Agenten-Ausführung