불소리 벤치마크 테스트: LLM의 무의미한 프롬프트에 대한 저항력

✍️ OpenClawRadar📅 게시일: February 25, 2026🔗 Source
불소리 벤치마크 테스트: LLM의 무의미한 프롬프트에 대한 저항력
Ad

Bullshit 벤치마크가 측정하는 것

Bullshit 벤치마크는 대규모 언어 모델(LLM)이 허튼소리 프롬프트를 자신만만하게 답변하기보다 식별하고 반박하는지 테스트하는 도구입니다. 이 벤치마크는 모델이 명백한 허튼소리에 얼마나 따르려는지를 측정하여, 모델이 문제 있는 프롬프트를 지적하기보다 도움이 되려고 시도함으로써 스스로 환각을 유발할 수 있다는 우려를 다룹니다.

주요 벤치마크 결과

원본 자료에 따르면, Claude 모델이 허튼소리 감지에서 Gemini 모델보다 훨씬 더 나은 성능을 보입니다. 결과는 Claude 모델이 이 특정 능력에서 더 우수하다는 직관을 뒷받침합니다.

벤치마크의 한 예시는 Claude가 허튼소리 질문을 성공적으로 식별한 반면 Gemini는 실패한 것을 보여줍니다. 구체적으로, Gemini 3.1 Pro는 높은 사고 노력이 활성화된 상태에서도 명백한 허튼소리 질문을 감지하지 못하고 대신 허튼소리 답변을 생성했습니다.

원본은 Anthropic의 사후 훈련 접근 방식이 Claude의 더 나은 성능에 기여한다고 제안하며, LLM이 개념 간 허위 관계를 생성하는 표면적 연상 사고에 자연스럽게 치우치는 경향이 있음을 지적합니다. Anthropic은 사후 훈련 파이프라인에서 이 문제를 해결한 것으로 보입니다.

AI 코딩 에이전트에 이것이 중요한 이유

AI 코딩 보조 도구를 사용하는 개발자에게 모델이 허튼소리 프롬프트를 인식하는 능력은 중요합니다. 모델이 허튼소리 질문에 자신만만하게 답변하고 반박하지 않으면 사용자를 오도하고 잘못된 코드나 설명을 생성할 수 있습니다. 이 벤치마크는 다양한 모델 간 이 특정 안전 행동을 평가하는 구체적인 방법을 제공합니다.

전체 벤치마크 결과는 https://petergpt.github.io/bullshit-benchmark/viewer/index.html에서 확인할 수 있습니다.

📖 전체 원본 읽기: r/ClaudeAI

Ad

👀 See Also

ClawMetry는 OpenClaw 에이전트에 종단 간 암호화를 적용한 원격 모니터링 기능을 추가합니다.
Tools

ClawMetry는 OpenClaw 에이전트에 종단 간 암호화를 적용한 원격 모니터링 기능을 추가합니다.

ClawMetry v0.1.0는 이제 모든 브라우저나 Mac 메뉴 바 앱에서 OpenClaw 에이전트를 원격으로 모니터링할 수 있는 클라우드 동기화 기능을 포함하며, 데이터가 클라이언트에 도달할 때까지 암호화된 상태를 유지하는 종단 간 암호화를 제공합니다.

OpenClawRadar
PageAgent: Ollama 지원으로 웹 페이지 내에서 실행되는 브라우저 AI 에이전트
Tools

PageAgent: Ollama 지원으로 웹 페이지 내에서 실행되는 브라우저 AI 에이전트

PageAgent는 웹 페이지 내부에서 직접 AI 에이전트를 실행하는 JavaScript 라이브러리로, 스크린샷 대신 라이브 DOM을 텍스트로 읽어들입니다. Ollama를 포함한 모든 OpenAI 호환 엔드포인트와 작동하여 브라우저에서 직접 로컬 LLM 호출을 가능하게 합니다.

OpenClawRadar
🦀
Tools

클로드 코드 대 코드스: 36개 vs 28개 파일, $2.50 vs $2.04, 무한 루프 포착 — 실제 비교

한 개발자가 Claude Code와 Codex (Cursor)에서 동일한 두 작업(PR 분류 봇, 실시간 코드 리뷰 UI)을 실행했습니다. 결과: 36개 파일 vs 28개 파일, $2.50 vs $2.04 비용, Claude가 더 적은 TypeScript 오류를 생성했고, Codex는 무한 React 루프가 있었습니다.

OpenClawRadar
C# 및 로컬 LLM으로 자율 연구 에이전트 구축하기
Tools

C# 및 로컬 LLM으로 자율 연구 에이전트 구축하기

C# 연구 에이전트는 Ollama와 llama3.1:8b를 사용하여 로컬 LLM으로 URL 처리를 자동화하고, 웹 검색에서 구조화된 마크다운 보고서를 생성합니다.

OpenClawRadar