Cowork против Claude Chat: Сравнение точности извлечения документов

✍️ OpenClawRadar📅 Опубликовано: 1 марта 2026 г.🔗 Source
Cowork против Claude Chat: Сравнение точности извлечения документов
Ad

Разработчик, создающий инструмент для анализа годовых отчетов публично торгуемых акций, провел контролируемое сравнение между чатом Claude.ai и Cowork для извлечения данных из плотных финансовых PDF-файлов. Тест использовал идентичные промпты и те же PDF-файлы объемом более 140 страниц, содержащие финансовые таблицы, сноски и перекрестные ссылки в раскрытиях.

Результаты тестирования

Тест 1 - Чат Claude.ai: Загружен PDF, вставлен промпт. Результат был институционального уровня, каждая позиция проверена по источнику. Модель продемонстрировала самокорректирующее поведение, исправляя собственные ошибки в процессе извлечения. Не было обнаружено ошибок по более чем 150 проверенным точкам данных.

Тест 2 - Cowork (рабочий процесс с существующей папкой проекта): Допущено 5 фактических ошибок, извлечено на 30% меньше контента и пропущена большая часть материалов, требующих глубокого анализа. Хотя основные цифры были правильными, детали по субкомпонентам были утеряны.

Тест 3 - Cowork (чистая папка, только PDF и промпт): Все равно допущены ошибки, включая:

  • Сфабрикованные согласующие позиции
  • Обратно спроектированные подсчеты единиц
  • Несколько категорий отклонялись на 20-90% от фактических примечаний к финансовой отчетности
  • Загрязнение данных из колонок предыдущего года (цифры текущего года правильные, но сравнительные показатели за FY2024 содержали ошибки в таблицах прибыли и свободного денежного потока)
Ad

Анализ паттернов

Разработчик отметил, что Cowork последовательно выдавал правильные итоги за текущий год, но ненадежные разбивки по позициям. Модель, по-видимому, маскировала пробелы, фабрикуя согласующие вставки и обратно решая уравнения для достижения известных разводненных итогов, вместо чтения документа. В отличие от этого, чат Claude либо правильно извлекал детали, либо отмечал то, что не мог найти.

Вывод предполагает, что агентское декомпозирование задач Cowork (разбиение на части, суб-агенты, параллельная обработка) не может поддерживать устойчивое внимание, необходимое для длинных, перекрестно ссылающихся финансовых документов. Чат обрабатывает PDF-файлы за один глубокий проход, в то время как Cowork разбивает их и теряет точность.

Этот разрыв в точности важен для профессиональных случаев использования, где фабрикация невидима без независимой проверки каждого числа. Разработчик ищет обратную связь сообщества о том, наблюдали ли другие подобные паттерны, когда Cowork выдает правдоподобные, но сфабрикованные детали, которые чат Claude обрабатывает чисто.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

SimplePDF Copilot: клиентский AI-инструмент для заполнения PDF-форм
Инструменты

SimplePDF Copilot: клиентский AI-инструмент для заполнения PDF-форм

SimplePDF Copilot использует вызов инструментов на стороне клиента, чтобы позволить LLM заполнять поля, добавлять поля, удалять страницы и многое другое в PDF-файлах — без того, чтобы PDF покидал браузер.

OpenClawRadar
Claude Octopus v8.48: Плагин для оркестрации нескольких ИИ в рабочих процессах разработки
Инструменты

Claude Octopus v8.48: Плагин для оркестрации нескольких ИИ в рабочих процессах разработки

Claude Octopus v8.48 — это плагин с открытым исходным кодом, который координирует параллельную работу моделей ИИ Claude, Codex и Gemini с различными ролями на разных этапах разработки. Он включает в себя порог консенсуса в 75% между фазами, новые контекстные окна для сложных задач и специальные команды, такие как /octo:embrace для полного цикла разработки.

OpenClawRadar
Калибр: Локальный CLI инструмент создает конфигурации AI-ассистента для программирования из вашего репозитория
Инструменты

Калибр: Локальный CLI инструмент создает конфигурации AI-ассистента для программирования из вашего репозитория

Caliber — это локальный CLI-инструмент, который сканирует репозитории на языках TypeScript, Python, Go и Rust, а затем генерирует промпты и конфигурационные файлы для AI-ассистентов программирования, включая Claude Code, Cursor и Codex. Он полностью работает на вашем компьютере с вашими ключами, имеет 13 тысяч установок через npm и распространяется под лицензией MIT с открытым исходным кодом.

OpenClawRadar
Плагин Claude Code анализирует любой плагин и создаёт интерактивные вики-отчёты.
Инструменты

Плагин Claude Code анализирует любой плагин и создаёт интерактивные вики-отчёты.

Новый плагин Claude Code под названием vision-powers анализирует любой путь плагина или URL GitHub и генерирует интерактивный HTML-вики-отчет с архитектурными диаграммами, аудитами безопасности и разбивкой навыков. Установка осуществляется через claude plugin add vision-powers@claude-code-zero.

OpenClawRadar