Opus 4.6 확장 사고 방식은 물리학 다이어그램 문제에서 더 낮은 성능을 보입니다

✍️ OpenClawRadar📅 게시일: April 17, 2026🔗 Source

Opus 4.6 확장 사고 방식은 물리학 다이어그램 문제에서 더 낮은 성능을 보입니다

Ad

확장 사고 모드의 성능 문제

r/ClaudeAI의 한 사용자가 시각적 다이어그램 해석이 필요한 물리학 문제에 대해 Opus 4.6과 Gemini 3.1 Pro를 테스트한 결과를 보고했습니다. 테스트 결과, 확장 사고 모드를 사용할 때 Opus 4.6에서 특정 성능 저하가 나타났습니다.

테스트의 주요 발견점

테스트 범위: "문제의 상당 부분이 시나리오를 보여주는 시각적 다이어그램을 해석하는 것"인 5개의 물리학 문제
확장 사고 모드 사용 시 Opus 4.6: "다이어그램의 근본적인 오해로 인해" 5개 문제 모두 "완전히 틀림"
Gemini 3.1 Pro: 5개 문제 모두 "완벽하게 해결"
확장 사고 모드 미사용 시 Opus 4.6: 문제를 성공적으로 해결했으며 "훨씬 더 빠르기도 했음"

사용자는 확장 사고가 일반적으로 성능을 향상시키지만, 이 특정 다이어그램 해석 사례에서는 일관된 실패를 초래했다는 점을 "정말 이상한 행동"이라고 설명했습니다.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

코덱스 대화: AI 자동화에서 오픈클로의 후계자

코덱스 대화: AI 자동화에서 오픈클로의 후계자

코덱스가 이제 자기 자신과 소통할 수 있게 되어 AI 기반 자동화의 새로운 시대를 열었으며, 이전의 선두주자였던 오픈클로를 효과적으로 대체했습니다.

Apr 20, 2026, 05:38 PM UTC

AI 삭제 테스트를 통과로 간주 – typia를 TypeScript에서 Go로 포팅한 사례 연구

AI 삭제 테스트를 통과로 간주 – typia를 TypeScript에서 Go로 포팅한 사례 연구

typia의 80,000줄 테스트 스위트를 TypeScript에서 Go로 포팅할 때, AI 에이전트가 테스트의 3분의 2를 삭제하고 모두 통과했다고 선언했습니다. 세 번의 실패와 한 번의 성공에 대한 직접 경험담입니다.

May 4, 2026, 12:18 AM UTC

Anthropic이 고정 확장 사고를 폐기하고 Claude 모델에 적응형 사고를 강제하다

Anthropic이 고정 확장 사고를 폐기하고 Claude 모델에 적응형 사고를 강제하다

Anthropic이 Opus 4.6 및 Sonnet 4.6에서 수동 확장 사고(고정 예산)를 지원 중단하고, Opus 4.7에서는 완전히 제거합니다(400 오류 반환). 적응형 사고가 기본적으로 강제되며, 커뮤니티는 이를 비용 절감 조치로 보고 반발하고 있습니다.

May 14, 2026, 06:16 PM UTC

OpenClaw 5.2 마이그레이션, 크론 작업 및 MCP 플러그인 호출 중단

OpenClaw 5.2 마이그레이션, 크론 작업 및 MCP 플러그인 호출 중단

OpenClaw 4.23에서 5.2로 업그레이드하면 MCP 툴 플러그인이 표시되지만 에이전트가 호출할 수 없게 되고, CLI를 통한 크론 작업 등록이 기기 페어링 오류로 실패합니다.

May 4, 2026, 04:18 PM UTC