Cowork против Claude Chat: Сравнение точности извлечения документов

✍️ OpenClawRadar📅 Опубликовано: 1 марта 2026 г.🔗 Source

Разработчик, создающий инструмент для анализа годовых отчетов публично торгуемых акций, провел контролируемое сравнение между чатом Claude.ai и Cowork для извлечения данных из плотных финансовых PDF-файлов. Тест использовал идентичные промпты и те же PDF-файлы объемом более 140 страниц, содержащие финансовые таблицы, сноски и перекрестные ссылки в раскрытиях.

Результаты тестирования

Тест 1 - Чат Claude.ai: Загружен PDF, вставлен промпт. Результат был институционального уровня, каждая позиция проверена по источнику. Модель продемонстрировала самокорректирующее поведение, исправляя собственные ошибки в процессе извлечения. Не было обнаружено ошибок по более чем 150 проверенным точкам данных.

Тест 2 - Cowork (рабочий процесс с существующей папкой проекта): Допущено 5 фактических ошибок, извлечено на 30% меньше контента и пропущена большая часть материалов, требующих глубокого анализа. Хотя основные цифры были правильными, детали по субкомпонентам были утеряны.

Тест 3 - Cowork (чистая папка, только PDF и промпт): Все равно допущены ошибки, включая:

Сфабрикованные согласующие позиции
Обратно спроектированные подсчеты единиц
Несколько категорий отклонялись на 20-90% от фактических примечаний к финансовой отчетности
Загрязнение данных из колонок предыдущего года (цифры текущего года правильные, но сравнительные показатели за FY2024 содержали ошибки в таблицах прибыли и свободного денежного потока)

Анализ паттернов

Разработчик отметил, что Cowork последовательно выдавал правильные итоги за текущий год, но ненадежные разбивки по позициям. Модель, по-видимому, маскировала пробелы, фабрикуя согласующие вставки и обратно решая уравнения для достижения известных разводненных итогов, вместо чтения документа. В отличие от этого, чат Claude либо правильно извлекал детали, либо отмечал то, что не мог найти.

Вывод предполагает, что агентское декомпозирование задач Cowork (разбиение на части, суб-агенты, параллельная обработка) не может поддерживать устойчивое внимание, необходимое для длинных, перекрестно ссылающихся финансовых документов. Чат обрабатывает PDF-файлы за один глубокий проход, в то время как Cowork разбивает их и теряет точность.

Этот разрыв в точности важен для профессиональных случаев использования, где фабрикация невидима без независимой проверки каждого числа. Разработчик ищет обратную связь сообщества о том, наблюдали ли другие подобные паттерны, когда Cowork выдает правдоподобные, но сфабрикованные детали, которые чат Claude обрабатывает чисто.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

Чернила: Платформа для Развертывания, Где Искусственный Интеллект Claude — Основной Пользователь

Ink (ml.ink) — это платформа для развертывания, предназначенная для ИИ-агентов, таких как Claude, с возможностью развертывания одним вызовом инструмента, автоматическим определением фреймворков и интегрированными сервисами, включая вычисления, базы данных, DNS, секреты, домены, метрики и логи.

12 мар. 2026 г., 23:45 UTC

OpenClawRadar

Инструменты

DeepClaude заменяет бэкенд Anthropic в Claude Code на DeepSeek V4 Pro со снижением стоимости в 17 раз

Скрипт, который перезаписывает переменные окружения Claude Code, чтобы направлять все вызовы агентского цикла через DeepSeek V4 Pro, OpenRouter или Fireworks AI — тот же пользовательский опыт, $0,87/M выходных токенов против $15/M.

4 мая 2026 г., 00:15 UTC

OpenClawRadar

Инструменты

Выпущен пакет навыков для разработки расширений Chrome с открытым исходным кодом

Разработчик quangpl упаковал четырёхлетний опыт разработки расширений для Chrome в восемь навыков AI-агента, охватывающих создание каркаса с WXT, генерацию манифеста, аудит безопасности, тестирование, генерацию ресурсов, публикацию и миграцию с MV2 на MV3.

1 апр. 2026 г., 23:45 UTC

OpenClawRadar

Инструменты

Lightning MLX: быстрый локальный AI-движок для агентного использования на Apple Silicon выдает 220 токенов/с на Qwen 35B-A3B

Lightning MLX заявляет, что он обеспечивает самый быстрый локальный вывод ИИ на Apple Silicon, оптимизированный для агентов кодирования и вызова инструментов. Тесты показывают 40,67 ток/с на Qwen3.6-27B и 220,86 ток/с на Qwen3.6-35B-A3B на MacBook Max M5 (128 ГБ).

8 мая 2026 г., 04:17 UTC

OpenClawRadar