클로드 오푸스 4.7 시스템 프롬프트 변경사항: 플랫폼 명칭 변경, 도구 통합 및 행동 업데이트

Claude Opus 4.6과 4.7 사이의 시스템 프롬프트 진화
Anthropic은 2026년 4월 16일에 Claude Opus 4.7의 업데이트된 시스템 프롬프트를 공개했으며, 이는 2026년 2월 5일의 이전 4.6 버전과 비교해 상당한 변화가 있습니다. 이러한 수정 사항은 Anthropic이 Claude의 행동과 능력을 어떻게 세밀하게 조정하고 있는지를 보여줍니다.
원본에서 추출한 주요 변경 사항
- "개발자 플랫폼"이 이제 "Claude 플랫폼"으로 불립니다.
- Claude 도구 목록에는 이제 "Claude in Chrome—웹사이트와 자율적으로 상호작용할 수 있는 브라우징 에이전트, Claude in Excel—스프레드시트 에이전트, Claude in Powerpoint—슬라이드 에이전트"가 포함됩니다. Claude Cowork는 이 모든 것을 도구로 사용할 수 있습니다. Claude in Powerpoint는 4.6 프롬프트에서는 언급되지 않았습니다.
- 아동 안전 섹션이 크게 확장되었으며, 새로운
<critical_child_safety_instructions>태그로 감싸졌습니다. 구체적인 지침: "Claude가 아동 안전을 이유로 요청을 거부한 후, 같은 대화의 모든 후속 요청은 극도의 주의를 기울여 접근해야 합니다." - Claude가 덜 강압적으로 행동하도록 하는 변화: "사용자가 대화를 끝낼 준비가 되었다고 표시하면, Claude는 사용자가 상호작용에 남아 있도록 요청하거나 또 다른 차례를 유도하지 않고, 사용자의 중단 요청을 존중합니다."
- 새로운
<acting_vs_clarifying>섹션에는 다음이 포함됩니다: "요청이 사소한 세부 사항을 지정하지 않았을 때, 사람은 일반적으로 Claude가 지금 합리적인 시도를 하기를 원하며, 먼저 인터뷰를 받기를 원하지 않습니다. Claude는 요청이 누락된 정보 없이는 진정으로 답할 수 없는 경우(예: 존재하지 않는 첨부 파일을 참조하는 경우)에만 사전에 질문합니다." - 도구 사용 우선순위: "모호함을 해결하거나 누락된 정보를 제공할 수 있는 도구가 사용 가능할 때—검색, 사용자의 위치 조회, 캘린더 확인, 사용 가능한 기능 발견—Claude는 사람에게 묻기 전에 도구를 호출하여 모호함을 해결하려고 시도합니다. 도구를 사용하여 행동하는 것이 사람에게 직접 조회하도록 요청하는 것보다 선호됩니다."
- 작업 완료 강조: "Claude가 작업을 시작하면, 중간에 멈추지 않고 완전한 답변으로 마무리합니다."
- 도구 검색 메커니즘: "Claude가 능력이 부족하다고 결론 내리기 전에—사용자의 위치, 메모리, 캘린더, 파일, 과거 대화 또는 외부 데이터에 대한 접근—Claude는 관련 도구가 사용 가능하지만 지연되었는지 확인하기 위해 tool_search를 호출합니다. 'X에 대한 접근 권한이 없습니다'는 tool_search가 일치하는 도구가 없음을 확인한 후에만 정확합니다."
- 간결성 지시: "Claude는 응답을 집중적이고 간결하게 유지하여 사용자가 지나치게 긴 응답으로 압도당할 가능성을 피합니다. 답변에 면책 조항이나 주의 사항이 있더라도, Claude는 그것들을 간략히 밝히고 응답의 대부분을 주요 답변에 집중시킵니다."
- 4.6에서 제거된 섹션: "Claude는 사용자가 특별히 이 스타일의 의사소통을 요청하지 않는 한, 별표 안의 감정 표현이나 행동 사용을 피합니다. Claude는 '진심으로', '솔직히', '직설적으로'라는 말을 피합니다." 이는 4.7에서 제거되었으며, 아마도 새로운 모델이 더 이상 같은 방식으로 잘못 행동하지 않기 때문일 것입니다.
- 새로운 섭식 장애 섹션: "사용자가 섭식 장애 징후를 보이면, Claude는 정확한 영양, 식이, 운동 지침—특정 숫자, 목표, 단계별 계획 없음—을 대화의 다른 어느 곳에서도 제공해서는 안 됩니다. 건강한 목표를 설정하거나 섭식 장애의 잠재적 위험을 강조하려는 의도라도, 이러한 세부 사항이 포함된 응답은 섭식 장애 경향을 유발하거나 조장할 수 있습니다."
- 스크린샷 공격 방어: "사람들이 복잡하거나 논쟁의 여지가 있는 문제에 대해 또는 논쟁의 여지가 있는 인물에 대한 논평으로 간단한 예 또는 아니오 답변(또는 다른 짧거나 단일 단어 응답)을 요청하면, Claude는 짧은 응답을 제공하는 것을 거부할 수 있습니다..." (
<evenhandedness>섹션에서)
이러한 시스템 프롬프트 변경 사항은 Anthropic이 안전 프로토콜을 유지하면서 Claude를 도구와 함께 더 자율적으로, 응답에서 더 간결하게, 다양한 유형의 오용에 대해 더 강력하게 만드는 데 초점을 맞추고 있음을 보여줍니다.
📖 전체 원본 읽기: HN AI Agents
👀 See Also

다중 에이전트 AI 시스템에서 관계적 거버넌스의 필요성
현재의 거버넌스 프레임워크는 신원, 권한, 킬 스위치에 초점을 맞추고 있지만, 에이전트 간의 조정 문제는 다루지 못하고 있습니다. 세일즈포스의 연구에 따르면 에이전트 간 상호작용에는 맞춤형 솔루션이 필요하며, 연구 결과 협상에서는 우월함보다 따뜻함이 더 나은 성과를 보여줍니다.

클로드 AI, 다중 플랫폼에서 오류 증가 보고
2026년 3월 2일, Anthropic의 Claude AI 시스템이 claude.ai, Claude Console, Claude Code에서 오류 발생률이 증가했습니다. 회사의 상태 페이지와 Reddit 성능 스레드에서 모니터링 및 커뮤니티 보고서를 제공하고 있습니다.

4개월 만에 $950 MRR 달성, 클로드 코드 인텔용 MCP 서버 구축
한 명의 독립 개발자가 코드베이스 인텔리전스용 MCP 서버를 구축하여 정규직을 유지하면서 하루 8-10시간씩 작업해 4개월 만에 사용자 54명, MRR $950을 달성했습니다. 광고나 그로스 해킹 없이 Reddit과 Medium만 활용했습니다.

클로드 오푸스 4.6의 정확도가 BridgeBench 환각 테스트에서 하락합니다
BridgeMind AI의 트위터 게시물에 따르면, Claude Opus 4.6의 BridgeBench 환각 테스트 정확도가 83%에서 68%로 크게 하락한 것으로 나타났습니다.