SWE-rebench-V2 출시: 코드 에이전트 훈련을 위한 가장 큰 오픈 멀티링구얼 데이터셋

✍️ OpenClawRadar📅 게시일: March 7, 2026🔗 Source
SWE-rebench-V2 출시: 코드 에이전트 훈련을 위한 가장 큰 오픈 멀티링구얼 데이터셋
Ad

SWE-rebench-V2 출시 상세 정보

Ibragim이 이끄는 Nebius의 R&D 팀이 SWE-rebench-V2를 공개했습니다. 이 데이터셋은 "현재 전 세계에서 코딩 에이전트 훈련을 위한 가장 큰 오픈 데이터셋"으로 설명되며, 다국어 지원 및 실행 가능한 형태로 대규모 강화 학습 훈련을 위해 특별히 설계되었습니다.

주요 기술 특징

팀은 대규모로 RL 환경을 추출하기 위한 자동화된 파이프라인을 구축했습니다. 이번 출시에는 다음이 포함됩니다:

  • 완전한 SWE-rebench-V2 데이터셋
  • 상세한 기술 보고서
  • 논문 및 데이터셋은 다음에서 확인 가능: https://huggingface.co/papers/2602.23866

커뮤니티 및 지원

팀은 데이터셋과 SWE-rebench 리더보드에 대한 활발한 Discord 지원을 유지하고 있습니다: https://discord.gg/wXYmWpMu. 그들은 LocalLLaMA 커뮤니티가 SWE-rebench 리더보드 작업에 대해 "가장 가치 있는 피드백"을 제공했다고 언급하며, 리더보드 작업을 계속하고 "더 멋지게 만들 계획"이라고 확인했습니다.

연구 협업이나 질문이 있는 경우, Ibragim은 Reddit 또는 Twitter(X) DM을 통해 연락할 수 있습니다: https://x.com/ibragim_bad.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

OpenClaw-superpowers는 운영 장애 모드에 대한 신뢰성 기능을 추가합니다.
Tools

OpenClaw-superpowers는 운영 장애 모드에 대한 신뢰성 기능을 추가합니다.

openclaw-superpowers 저장소가 배포 전 검사, cron 실행 증명, 세션 재설정 복구, MCP 인증 수명 주기 관리 등 신뢰성에 초점을 맞춘 8가지 새로운 스킬로 확장되었습니다. 이로써 총 스킬 수는 60개가 되었으며, 그중 44개는 OpenClaw 네이티브 스킬이고 23개는 cron 스케줄링을 위해 설계되었습니다.

OpenClawRadar
포켓봇: iOS 앱이 자연어로부터 결정론적 JavaScript 자동화를 생성하기 위해 Claude를 사용합니다
Tools

포켓봇: iOS 앱이 자연어로부터 결정론적 JavaScript 자동화를 생성하기 위해 Claude를 사용합니다

PocketBot은 AWS Bedrock을 통해 Claude를 활용하여 일반 언어 요청을 독립적인 JavaScript 스크립트로 변환하는 iOS 모바일 자동화 앱입니다. LLM이 코드를 한 번 작성하면, 결정론적 스크립트가 AI 개입 없이 샌드박스 런타임에서 예약 실행됩니다.

OpenClawRadar
GrapeRoot Pro, 클로드 코드가 프로젝트를 삭제하는 것을 방지하는 Undo Shield 추가
Tools

GrapeRoot Pro, 클로드 코드가 프로젝트를 삭제하는 것을 방지하는 Undo Shield 추가

Reddit에서 Claude Code가 전체 프로젝트를 삭제했다는 보고가 잇따르자, GrapeRoot Pro는 Claude의 세션 그래프를 모니터링하고 rm -rf 같은 파괴적 명령을 차단하는 Undo Shield를 출시했습니다.

OpenClawRadar
클로드 코드 훅은 여러 세션 간의 크롬 탭 간섭을 방지합니다.
Tools

클로드 코드 훅은 여러 세션 간의 크롬 탭 간섭을 방지합니다.

한 개발자가 세 개의 훅(session-start, capture-tab-id, enforce-tab-id)을 만들어 각 Claude Code 세션을 자체 Chrome 탭에 고정시켰습니다. 이를 통해 테스트 실행 및 폼 작성 중에 세션이 실수로 다른 세션의 탭에 접근하는 것을 방지합니다.

OpenClawRadar