클로드 코드가 10,069자리 에미르프 기록을 찾는 파이썬 스크립트를 생성합니다

Claude Code는 Anthropic의 Opus 4.6 모델을 사용하여 약 하루 동안의 CPU 시간으로 10,069자리 에미르프(역전 가능한 소수)를 발견하는 Python 스크립트를 생성하여 새로운 세계 기록을 세웠습니다. 사용자는 Claude에게 이전 기록에 관한 Numberphile 동영상을 제공하고 개인용 컴퓨터에서 그 기록을 깨도록 요청했습니다.
기술적 구현
Claude는 처음에 "몇 일 동안의 실행 시간" 내에 에미르프를 찾을 수 있는 Python 스크립트를 만들었습니다. 추가 논의를 통해 네 단계의 연속적인 소수 체를 가진 최적화된 버전을 생성했습니다. 최적화에는 다음이 포함됩니다:
- "232보다 작은 인수가 없는 빠른 난수 생성을 위한 엄청나게 빠른 CUDA 커널"
- 대수적 지름길 없이 순수한 무차별 대입 접근법
- 출력에 "불만족스러운 0의 연속" 없음
사용자는 자신이 "수학자도 아니고 전일제 프로그래머도 아니며", "구현된 대부분의 알고리즘은 어제까지 들어본 적이 없었다"고 언급했습니다.
출력 및 검증
결과 숫자는 'BPSW 확률적' 에미르프로, 소수성에 대한 강력한 확률적 검증을 제공하지만 아직 엄격한 증명은 아닙니다. 사용자는 primo 소프트웨어를 사용하여 공식 증명 작업을 진행 중입니다. 10,069자리 숫자는 이 과정을 통해 생성되었습니다.
이 접근법은 "산술적 해킹을 사용하고 소수 찾기 커뮤니티의 광범위한 노력과 지식을 활용했다"고 설명된 Numberphile 동영상의 이전 기록 시도와 대조됩니다.
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

APEX MoE Quants 업데이트: 25개 이상의 새로운 모델과 I-나노 등급 출시
APEX MoE 인식 혼합 정밀도 양자화가 Qwen, Mistral, Gemma 및 하이브리드 SSM 제품군 전반에 걸쳐 30개 이상의 모델로 확장되고, 중간 계층 전문가에서 2.06bpw까지 낮추는 새로운 I-Nano 계층이 추가되었습니다.

오픈소스 모델이 벤치마크에서 Claude Opus 4.6을 따라잡거나 능가합니다
DeepSeek V3.2, DeepSeek R1, Kimi K2.5, MiniMax M2.5는 MMLU-Pro, 속도, 도구 사용, 추론 등 5개 주요 벤치마크 중 4개에서 Claude Opus 4.6을 능가하면서도 상당히 저렴합니다.

간단한 자기 증류 방법이 LLM 코드 생성 성능을 향상시킵니다
연구자들은 LLM을 자체 샘플링된 출력(단순 자기 증류)으로 미세 조정하면 코드 생성 성능이 향상된다는 것을 보여주었으며, Qwen3-30B-Instruct의 LiveCodeBench v6 pass@1 성능을 42.4%에서 55.3%로 향상시켰습니다.

로봇공학의 세 가지 역법칙: AI 사용을 위한 인간 지침
Susam Pal은 인간을 위한 세 가지 역로봇공학 법칙을 제안합니다: AI를 의인화하지 말고, 그 출력을 맹신하지 말며, 전적인 책임을 유지하라는 것입니다. 생성형 AI에 대한 과도한 의존을 경계하는 실용적인 경고입니다.