Claude Opus 4.6 effort=low 매개변수는 에이전트의 게으른 행동을 유발합니다

Claude Opus 4.6의 effort 매개변수는 다른 AI 제공업체의 유사한 설정과 다르게 작동하여 low로 설정했을 때 예상치 못한 에이전트 행동을 유발합니다.
주요 발견 사항
테스트 결과, effort=low로 설정했을 때 Claude Opus 4.6은 예상보다 훨씬 더 게으른 행동을 보였습니다:
- 더 적은 도구 호출을 수행함
- 교차 참조를 덜 철저히 함
- 웹 연구 수행 방법을 지시하는 시스템 프롬프트의 일부를 사실상 무시함
- 정보 검색을 중단하여 자신 있게 잘못된 답변을 반환함
출처에 따르면 effort=medium으로 높이면 이러한 모든 문제가 해결되었습니다. 문서에 의하면, Anthropic의 effort 매개변수는 OpenAI의 reasoning.effort=low나 Gemini의 thinking_level=low처럼 단순히 추론 깊이만을 제어하는 것이 아니라 일반적인 행동적 노력을 제어합니다.
중요한 차이점
이는 버그가 아니라 구현상의 문서화된 차이입니다. Claude Opus 4.6의 effort 매개변수는 다른 제공업체의 동등한 매개변수보다 더 넓은 범위를 가집니다. 이는 서로 다른 AI 제공업체 간에 작업할 때 effort를 reasoning.effort나 thinking_level의 대체품으로 취급할 수 없음을 의미합니다.
테스트는 effort=low가 다른 제공업체의 low-effort 설정과 유사하게 작동할 것이라는 기대 하에 수행되었지만, 실제 행동은 더 극단적이어서 에이전트가 단순히 덜 생각하는 것이 아니라 전반적으로 더 게으르게 행동했습니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

DeepSeek, 최신 AI 모델을 Nvidia와 AMD에 공개하지 않음
로이터 소식통에 따르면 딥시크가 엔비디아와 AMD를 포함한 미국 칩 제조업체에 최신 AI 모델을 제공하지 않고 있다고 합니다. 이 기사는 해커 뉴스에서 19점과 3개의 댓글을 받았습니다.

1.2B 로컬 모델, 1T 클라우드 모델을 포커에서 이기다: 올인 또는 폴드 형식에서 지식보다 공격성
1.2B Liquid 모델이 최대 1T 파라미터 모델들과의 5개의 텍사스 홀덤 토너먼트 중 2개에서 승리했습니다. 숏스택 형식에서는 스마트한 플레이보다 절대 폴드하지 않는 것이 더 많은 칩을 벌었기 때문입니다.

바이브 코딩 대 프로덕션 현실: 논의되지 않은 책임
Reddit 사용자 External_Bobcat8183은 바이브 코딩을 통한 빠른 PoC와 실제 프로덕션 문제(인증, 시크릿, GDPR, 속도 제한, 멀티테넌시) 사이의 격차를 지적합니다.

Claude-Code v2.1.92는 Bedrock 설정 마법사, 비용 세부 내역, 그리고 여러 가지 수정 사항을 추가했습니다.
Claude-Code v2.1.92는 대화형 AWS Bedrock 설정 마법사, 구독자를 위한 모델별 비용 상세 내역, 하위 에이전트 생성, 프롬프트 훅 및 터미널 표시 문제 수정을 도입합니다. 이번 릴리스에서는 /tag 및 /vim 명령어도 제거되었습니다.