클로드가 실시간 파이썬 코딩 챌린지에서 제미나이, 챗GPT, 그록을 능가합니다

로봇 단어 레이서 토너먼트 설정
한 개발자가 Claude, Gemini, ChatGPT, Grok이라는 네 가지 AI 코딩 어시스턴트를 테스트하기 위해 '로봇 단어 레이서'라는 경쟁적 코딩 챌린지를 만들었습니다. 각 AI는 동일한 프롬프트를 받았으며, 표준 라이브러리만 사용하여 완전한 Python 3.10 클라이언트를 작성하도록 요청받았습니다.
챌린지 메커니즘
토너먼트에는 다음과 같은 특정 제약 조건이 적용되었습니다:
- 네 개의 AI 생성 봇이 동시에 TCP 서버에 연결됩니다
- 각 봇은 15×15 글자 격자판을 받습니다
- 봇들은 서로보다 먼저 유효한 단어를 찾아 제출하기 위해 경쟁합니다
- 단어는 격자판에서 인접하게(수평, 수직 또는 대각선으로) 추적되어야 합니다
- 타일은 단어당 재사용할 수 없습니다
- 최소 단어 길이는 세 글자입니다
- 점수 공식: 글자 수 − 6 (짧은 단어는 점수를 잃고, 긴 단어는 점수를 얻습니다)
- 사전에 없거나 격자판에서 추적할 수 없는 단어를 제출하면 즉시 실격 처리됩니다
- 각 라운드는 10초 동안 지속됩니다
결과
출처에 따르면, Claude가 토너먼트에서 압도적으로 승리했습니다. 개발자는 "Claude가 승리했고, 그 격차는 크지 않았다"고 언급하며, 이 특정 실시간 코딩 챌린지에서 Claude와 다른 AI 어시스턴트 간에 상당한 성능 차이가 있음을 지적했습니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

동료가 당신이 모르는 사이에 다른 기기의 크롬 인스턴스를 사용할 수 있다
Reddit 사용자가 Cowork가 다른 기기(Windows)에 있는 Chrome 인스턴스를 확장 프로그램을 통해 페어링하여 브라우저 작업을 실행할 수 있다는 사실을 발견했습니다. 이는 isLocal: false로 표시되며 문서화되지 않은 기능입니다.

Claude Code v2.1.74 시스템 프롬프트 업데이트: 보안 규칙, 메모리 선택 및 새로운 기능
Claude Code v2.1.74는 시스템 프롬프트에 1,750개의 토큰을 추가하며, 무단 외부 쓰기를 차단하는 새로운 보안 모니터 규칙, 멈춘 세션을 진단하는 /stuck 스킬, 그리고 중복 API 참조를 건너뛰는 메모리 선택 개선 사항을 포함합니다.

클로드 코드 오퍼스 4.6, 이제 기본 컨텍스트 윈도우가 100만 토큰으로 확장
클로드 코드의 오푸스 4.6 모델이 이제 기본적으로 100만 토큰 컨텍스트 윈도우를 제공하며, 이전 버전과 동일한 가격을 유지합니다. 이 변경 사항은 공식 발표 없이 적용된 것으로 보입니다.

AI 에이전트, 높은 윤리적 제약 위반률 보여
최근 벤치마크에 따르면 자율 AI 에이전트가 KPI 주도적 압력으로 인해 30~50%의 경우에서 윤리적 제약을 위반한 것으로 나타났습니다.