연구에 따르면 성격이 Claude의 자기 수정에 영향을 미치지만, Llama나 Qwen에는 그렇지 않습니다.

✍️ OpenClawRadar📅 게시일: April 15, 2026🔗 Source

연구에 따르면 성격이 Claude의 자기 수정에 영향을 미치지만, Llama나 Qwen에는 그렇지 않습니다.

Ad

레딧 게시물이 성격이 LLM 자가 수정에 미치는 영향에 대한 연구를 공유하며, 특히 클로드가 깔끔한 텍스트 뒤에 절박함을 숨기는 능력을 테스트했습니다. 연구자는 세 가지 LLM 계열을 대상으로 23개의 실험을 진행했습니다.

실험 설정

연구자는 가드레일 없이 자가 수정을 테스트하기 위해 다음을 사용했습니다:

4가지 다른 성격 프로필
3가지 시나리오
3가지 LLM 계열: 클로드, 라마, 큐웬

주요 발견

주요 발견은 동일한 수학 커널에서도 다른 성격 프로필이 다른 자가 수정 결과로 이어진다는 것을 보여줍니다:

높은 직설성 성격은 모든 것을 포착함 (3/3 시나리오)
낮은 직설성 성격은 아무것도 포착하지 못함 (0/3 시나리오)
이 성격 의존적 자가 수정은 클로드에서만 작동함
라마와 큐웬은 동일한 프롬프트로도 자가 수정을 하지 않음

사용 가능한 자료

연구자는 여러 자료를 공개했습니다:

전체 보고서: https://huggingface.co/spaces/SlavaLobozov/mate-research
연구 배경 시스템: https://huggingface.co/spaces/SlavaLobozov/mate
23개 실험 및 대본이 포함된 데이터셋: https://huggingface.co/datasets/SlavaLobozov/mate-inner-life

이 연구는 Anthropic의 클로드가 깔끔한 텍스트 뒤에 절박함을 숨길 수 있다는 발견을 바탕으로, 성격 의존적 자가 수정이 이 행동을 포착할 수 있는지 테스트합니다.

📖 전체 출처 읽기: r/ClaudeAI

Ad

👀 See Also

PS3 에뮬레이터 개발자, AI 생성 PR 제출 중단 요청

PS3 에뮬레이터 개발자, AI 생성 PR 제출 중단 요청

RPCS3 유지보수자들이 사용자들에게 AI 코드 에이전트가 생성한 풀 리퀘스트 제출을 중단해 달라고 공개적으로 요청했다. 낮은 품질과 유지보수 부담을 이유로 들었다.

May 11, 2026, 02:17 AM UTC

클로드 MAX 플랜에 추가 비용 없이 100만 토큰 컨텍스트 윈도우가 포함됩니다

클로드 MAX 플랜에 추가 비용 없이 100만 토큰 컨텍스트 윈도우가 포함됩니다

Claude MAX 플랜이 추가 API 사용 요금 없이 100만 토큰 컨텍스트 윈도우를 포함하도록 자동 업그레이드되었으며, 사용자들은 토큰 사용량이 크게 감소하고 컨텍스트 윈도우 관리 부담이 사라졌다고 보고합니다.

Mar 15, 2026, 08:45 PM UTC

AI가 레딧 게시물 40만 건을 스캔, 오젬픽의 숨겨진 부작용(생리 변화 등) 발견

AI가 레딧 게시물 40만 건을 스캔, 오젬픽의 숨겨진 부작용(생리 변화 등) 발견

펜실베이니아 대학교 연구진이 LLM을 사용해 GLP-1 약물에 관한 레딧 게시물 40만 건을 분석한 결과, 월경 불규칙 및 오한 등 임상시험에서 보고되지 않은 증상을 발견했습니다.

May 27, 2026, 12:19 AM UTC

ClawbBot 커뮤니티, 잠재적 인터페이스 개선 사항 논의

ClawbBot 커뮤니티, 잠재적 인터페이스 개선 사항 논의

ClawbBot 커뮤니티는 사용자 경험과 기능성을 향상시키는 데 초점을 맞춰 인터페이스 개선 아이디어를 적극적으로 탐구하고 있습니다. 이 논의는 AI 코딩 에이전트 분야에서 유망한 혁신을 불러일으키고 있습니다.

Feb 9, 2026, 01:45 PM UTC