O benchmark IDP Leaderboard mostra que o Claude Sonnet 4.6 iguala o Opus 4.6 em tarefas de IA para documentos.

✍️ OpenClawRadar📅 Publicado: March 11, 2026🔗 Source

O IDP Leaderboard, um benchmark aberto para IA de documentos, publicou resultados comparando os modelos Claude em tarefas de processamento de documentos. O benchmark testou 16 modelos em várias categorias usando mais de 9.000 documentos reais.

Resultados do Benchmark

As pontuações dos modelos Claude no IDP Leaderboard:

Claude Sonnet 4.6: 80,8 no geral
Claude Opus 4.6: 80,3 no geral
Claude Haiku 4.5: 69,6 no geral

Sonnet e Opus tiveram desempenho essencialmente equivalente em tarefas de extração, incluindo texto, tabelas, fórmulas e análise de layout. Os gráficos de radar de ambos os modelos são idênticos de acordo com os resultados do benchmark.

Comparação de Custos

A fonte observa diferenças significativas de custo:

Sonnet custa US$ 24 por 1.000 páginas
Opus custa US$ 40 por 1.000 páginas

Para cargas de trabalho de processamento de documentos, o benchmark sugere que não há motivo para usar o Opus, considerando o desempenho equivalente a um custo menor.

Advertência Importante

Uma descoberta notável: os modelos Claude tinham moderação de conteúdo mais rigorosa, o que afetou o desempenho em certos tipos de documentos. Digitalizações de jornais antigos, páginas de livros didáticos e documentos históricos às vezes acionaram filtros de conteúdo. Esse problema só apareceu nos benchmarks OlmOCR e OmniDoc.

Todas as previsões do benchmark estão visíveis no Results Explorer em idp-leaderboard.org, onde você pode ver exatamente o que cada modelo Claude produziu em cada documento.

📖 Leia a fonte completa: r/ClaudeAI

👀 See Also

News

Automatizando as Mídias Sociais com OpenClaw: Possibilidades e Debates

Uma discussão no Reddit explora o potencial de automatizar tarefas de mídia social usando o OpenClaw.

Feb 13, 2026, 01:45 AM UTC

OpenClawRadar

News

Tribunal de Nova Iorque Decide que Documentos Jurídicos Gerados por IA Não São Protegidos por Privilégio

O juiz Jed S. Rakoff decidiu que 31 documentos gerados usando a ferramenta de IA Claude da Anthropic não eram protegidos pelo sigilo advogado-cliente nem pela doutrina do produto de trabalho, marcando a primeira decisão judicial sobre materiais jurídicos gerados por IA.

Mar 3, 2026, 05:45 AM UTC

OpenClawRadar

News

Novo Lançamento da OpenClaw: Uma Simples Mudança de Nome ou uma Grande Atualização?

O OpenClaw, anteriormente conhecido como ClawDBot, passou por uma transformação. Continue lendo para descobrir se essa mudança é apenas cosmética ou se introduz novos recursos e estabilidade aprimorada.

Feb 8, 2026, 01:45 PM UTC

OpenClawRadar

News

Aplicação da Lei dos EUA Declara 'Extremismo Antitecnologia' como Nova Categoria de Ameaça em Meio à Reação Contra IA

DHS, FBI e centros de fusão estão monitorando o 'extremismo violento antitecnologia' — uma nova categoria que visa protestos, ameaças a data centers e dissidência relacionada à IA sob as diretivas de Trump.

Jun 15, 2026, 12:16 AM UTC

OpenClawRadar