Testes de Benchmark de Bobagens Avaliam a Resistência de LLMs a Prompts Sem Sentido

✍️ OpenClawRadar📅 Publicado: February 25, 2026🔗 Source
Testes de Benchmark de Bobagens Avaliam a Resistência de LLMs a Prompts Sem Sentido
Ad

O que o Bullshit Benchmark Mede

O Bullshit Benchmark é uma ferramenta para testar se os grandes modelos de linguagem (LLMs) identificam e contestam prompts sem sentido, em vez de respondê-los com confiança. Ele mede o quanto um modelo está disposto a concordar com obviedades sem sentido, abordando preocupações de que os modelos possam induzir alucinações ao tentar ser úteis em vez de apontar prompts problemáticos.

Principais Resultados do Benchmark

De acordo com o material de origem, os modelos Claude apresentam um desempenho significativamente melhor do que os modelos Gemini na detecção de nonsense. Os resultados apoiam a intuição de que os modelos Claude são melhores nessa capacidade específica.

Um exemplo do benchmark mostra o Claude identificando com sucesso uma pergunta sem sentido, enquanto o Gemini falhou. Especificamente, o Gemini 3.1 Pro não conseguiu detectar uma pergunta obviamente sem sentido, mesmo com o esforço de pensamento alto ativado, gerando em vez disso uma resposta sem sentido.

A fonte sugere que a abordagem de pós-treinamento da Anthropic contribui para o melhor desempenho do Claude, observando que os LLMs naturalmente tendem a um pensamento associativo superficial que gera relações espúrias entre conceitos. A Anthropic parece ter abordado essa questão em seu pipeline de pós-treinamento.

Ad

Por que Isso Importa para Agentes de IA de Codificação

Para desenvolvedores que usam assistentes de codificação de IA, a capacidade de um modelo de reconhecer prompts sem sentido é crucial. Quando os modelos respondem com confiança a perguntas sem sentido em vez de contestá-las, eles podem enganar os usuários e gerar código ou explicações incorretos. Este benchmark fornece uma maneira concreta de avaliar esse comportamento de segurança específico em diferentes modelos.

Você pode visualizar os resultados completos do benchmark em https://petergpt.github.io/bullshit-benchmark/viewer/index.html.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

Código de reimplementação do Claude de código aberto corrigido para compatibilidade com modelos locais
Tools

Código de reimplementação do Claude de código aberto corrigido para compatibilidade com modelos locais

Um desenvolvedor corrigiu a reimplementação de código aberto do Claude Code para funcionar com Ollama e modelos locais, removendo as dependências embutidas do cliente da Anthropic. A CLI agora detecta automaticamente os provedores a partir dos nomes dos modelos e variáveis de ambiente.

OpenClawRadar
SeeFlow: Diagramas de Arquitetura Conectados ao Seu Aplicativo ao Vivo
Tools

SeeFlow: Diagramas de Arquitetura Conectados ao Seu Aplicativo ao Vivo

SeeFlow gera um fluxograma a partir do seu código-fonte e conecta cada nó ao seu aplicativo em execução, com plugins para Claude Code, Codex, Cursor, Windsurf e um servidor MCP.

OpenClawRadar
AutoProber: Automação de sondas voadoras orientada por IA para hacking de hardware
Tools

AutoProber: Automação de sondas voadoras orientada por IA para hacking de hardware

AutoProber é uma pilha de automação de sondas voadoras para hackers de hardware que permite que agentes de IA descubram alvos, mapeiem imagens de microscópio, realizem movimentos CNC monitorados por segurança, revisem sondas e conduzam sondagens controladas de pinos. Inclui código de controle em Python, um painel web, arquivos CAD e opera com controladores CNC GRBL, microscópios USB e monitoramento de segurança por osciloscópio.

OpenClawRadar
Extensão de Navegador Colorizadora da Barra de Uso do Claude Construída com Claude Code
Tools

Extensão de Navegador Colorizadora da Barra de Uso do Claude Construída com Claude Code

Um desenvolvedor criou uma extensão de navegador que recolore as barras de uso do Claude de verde para amarelo e vermelho com base em limites percentuais, adiciona um popup com dados de uso em tempo real e permite personalizar os limites e cores. A extensão só funciona na página de uso do Claude, armazena configurações localmente e não faz nenhuma solicitação de rede externa.

OpenClawRadar