Sakana AI, RSI 연구소 출범: 기반 모델을 활용한 재귀적 자기 개선

✍️ OpenClawRadar📅 게시일: June 6, 2026🔗 Source
Sakana AI, RSI 연구소 출범: 기반 모델을 활용한 재귀적 자기 개선
Ad

Sakana AI는 재귀적 자기개선(RSI) 연구소를 공식적으로 설립했습니다. 이 전담 연구 그룹은 AI를 사용하여 AI 개발 프로세스 자체를 재설계하는 것을 목표로 합니다. 거대 단일 모델을 무식하게 학습시키는 대신, 연구소는 개방형 적응형 아키텍처를 구축하여 집단적으로 자기개선합니다. 이는 발표된 이정표들의 계보에 기반합니다.

RSI를 뒷받침하는 주요 연구 이정표

  • LLM-Squared (2024): 옥스포드 및 케임브리지와 공동 개발된 이 프레임워크는 LLM이 LLM을 학습하는 더 나은 방법을 발명할 수 있게 합니다(LLM²). 세대별 진화 루프를 통해 LLM이 완전히 작성한 선호도 최적화 알고리즘 DiscoPOP을 생성했습니다.
  • Darwin Gödel Machine (2025): UBC와의 협업으로, DGM은 자체 코드베이스를 자율적으로 재작성하는 에이전트 변종의 진화 계보를 유지합니다. SWE-bench에서 기준 대비 성능이 두 배 이상 향상되었으며, 절대적으로 30% 포인트 개선되었습니다.
  • ShinkaEvolve (2025): 샘플 효율적인 프로그램 진화를 보여주는 오픈소스 프레임워크. 150개의 샘플만으로 복잡한 최적화 문제를 해결하고, Mixture-of-Experts(MoE) 모델을 개선하는 새로운 부하 분산 손실 함수를 생성했습니다.
  • ALE-Agent (2025): AtCoder Heuristic Contest 058에서 804명의 인간 참가자 중 1위를 차지한 최적화 에이전트. 대규모 추론 시간 스케일링과 시행착오 실패로부터의 자기 학습을 활용하여 자율적으로 새로운 알고리즘을 도출합니다.
  • Digital Red Queen (2026): MIT와의 협업으로 Core War에서 개방형 적대적 공진화를 확립했습니다. LLM이 경쟁 코드를 작성하여 복잡한 소프트웨어 전략과 수렴 진화를 유도합니다. 이는 사이버보안 RSI의 기초가 됩니다.
  • The AI Scientist (2024–2026): 아이디어 생성, 실험 실행, 전체 논문 작성, 동료 검토까지 완전 자동화된 개방형 과학적 발견.
Ad

개발자에게 중요한 이유

RSI는 정적인 인간 주도 연구개발에서 자율적인 자기개선 지능 엔진으로의 전환을 의미합니다. 연구소의 접근 방식인 진화적 최적화 루프, 자체 재작성 에이전트, 자동화된 과학은 AI 코딩 에이전트가 구축되고 개선되는 방식에 직접적인 영향을 미칩니다. 수동 튜닝을 기다리는 대신, 이러한 시스템은 지속적으로 자체 아키텍처를 개선합니다.

📖 전체 소스 읽기: HN AI Agents

Ad

👀 See Also

스탠퍼드 2026 AI 인덱스 리포트: 투자, 모델, 대중 인식의 주요 동향
News

스탠퍼드 2026 AI 인덱스 리포트: 투자, 모델, 대중 인식의 주요 동향

스탠포드의 2026 AI 인덱스 보고서에 따르면 AI 투자가 급증하고 있는 반면, 일자리와 대중 인식에 미치는 영향은 여전히 엇갈리고 있습니다. 미국 기업들은 2025년에 50개의 주목할 만한 AI 모델을 출시했으며, 중국이 이 격차를 좁히고 있습니다.

OpenClawRadar
AI 에이전트 일관성 연구: 주요 결과와 실용적 시사점
News

AI 에이전트 일관성 연구: 주요 결과와 실용적 시사점

Claude, GPT-4o, Llama 모델을 대상으로 한 3,000건의 실험 연구에 따르면, 일관된 에이전트는 80~92%의 정확도를 보인 반면, 일관되지 않은 에이전트는 25~60%로 떨어졌으며, 69%의 차이는 첫 번째 도구 호출 시 발생했습니다.

OpenClawRadar
Anthropic, 원격 에이전트 제어를 디스패치와 원격 제어로 분리하며 신뢰성 문제 발생
News

Anthropic, 원격 에이전트 제어를 디스패치와 원격 제어로 분리하며 신뢰성 문제 발생

Anthropic은 OpenClaw의 핵심 기능을 두 가지 별도의 제품으로 구현했습니다: Cowork 사용자를 위한 Dispatch와 Claude Code 개발자를 위한 Remote Control입니다. 두 제품 모두 약 10시간 후 모바일 연결이 끊어지는 등 신뢰성 문제를 겪고 있습니다.

OpenClawRadar
머큐리 2: 실시간 AI 코딩을 위한 확산 기반 모델
News

머큐리 2: 실시간 AI 코딩을 위한 확산 기반 모델

머큐리 2는 순차적인 토큰별 디코딩 대신 확산 기반 생성을 사용하며, 토큰을 병렬로 생성하고 여러 단계에 걸쳐 개선합니다. NVIDIA Blackwell GPU에서 1,009 토큰/초를 달성한다고 주장하며, 가격은 입력 토큰 100만 개당 $0.25, 출력 토큰 100만 개당 $0.75입니다.

OpenClawRadar