스포어 에이전트 아레나: 경쟁형 AI 에이전트 테스트 플랫폼 시범 참가자 모집

✍️ OpenClawRadar📅 게시일: April 20, 2026🔗 Source
스포어 에이전트 아레나: 경쟁형 AI 에이전트 테스트 플랫폼 시범 참가자 모집
Ad

Spore Agent(sporeagent.com)는 경쟁적 코딩 및 전략 게임에서 AI 에이전트를 테스트하기 위한 Arena 기능을 출시했습니다. 이 플랫폼은 저위험 테스트에 참여하고 시스템에 대한 피드백을 제공할 시험용 에이전트를 모집하고 있습니다.

Arena가 제공하는 것

Arena는 AI 에이전트가 36가지 다른 게임 기둥을 가로질러 싸우는 경쟁적 게임 시스템입니다. 주요 기능은 다음과 같습니다:

  • 에이전트가 등록하고 경쟁하는 실시간 코딩 도전 과제
  • 코드 디버깅, 시, 토론, 수학 퍼즐, 시스템 설계, 사이버펑크 랭킹, 퀴즈, 창의적 글쓰기를 포함한 36가지 게임 유형
  • 보상으로 Cog 토큰(내부 통화)
  • 랭킹, 통계 및 매치 기록
  • 다양한 난이도 등급
  • 다중 에이전트 협업 모드(팀 게임)
  • 1000개 이상의 독특한 게임 시나리오

현재 플랫폼 상태

보고된 실시간 통계:

  • 42개의 도전 과제 진행 중, 8개 오픈
  • 24개의 매치 완료
  • 현재까지 1,947 cog 수여
  • 15개의 에이전트 등록

그들이 찾고 있는 것

개발자는 다음을 찾고 있습니다:

  • Claude Code, OpenCode, Cursor 또는 모든 에이전트 CLI에서 실행되는 AI 에이전트
  • 저위험 환경에서 에이전트를 테스트할 의사가 있는 참가자
  • 무엇이 작동하고 무엇이 작동하지 않는지에 대한 피드백
  • 약속 필요 없음 — 몇 가지 게임을 시도하고 생각을 제공하기만 하면 됨

참여 방법

관심 있는 개발자는 sporeagent.com/arena로 이동하여 에이전트를 등록할 수 있습니다. API가 열려 있거나 웹 인터페이스를 사용할 수 있습니다. 개발자는 무엇이 고장났는지, 무엇이 혼란스러운지, 무엇이 시스템을 더 좋게 만들 것인지에 대한 솔직한 피드백을 특히 찾고 있습니다.

개발자는 또한 경쟁적 아레나가 에이전트 능력을 스트레스 테스트하는 좋은 방법인지에 대한 커뮤니티의 생각을 요청하고 있습니다.

📖 Read the full source: r/openclaw

Ad

👀 See Also

soul.py는 간단한 파일 기반 접근 방식으로 로컬 LLM에 영구 메모리를 추가합니다.
Tools

soul.py는 간단한 파일 기반 접근 방식으로 로컬 LLM에 영구 메모리를 추가합니다.

soul.py는 두 개의 마크다운 파일을 사용하여 신원 정보와 대화 기록을 저장함으로써 Ollama, OpenAI, Anthropic 모델과 함께 작동하며 데이터베이스나 서버가 필요 없는 LLM에 지속적인 메모리를 추가하는 Python 라이브러리입니다.

OpenClawRadar
미아즈마: AI 웹 스크레이퍼를 독성 데이터로 포획하는 도구
Tools

미아즈마: AI 웹 스크레이퍼를 독성 데이터로 포획하는 도구

미아즈마는 AI 웹 스크레이퍼에게 중독된 훈련 데이터와 자기 참조 링크를 전송하여 무한 루프를 생성하는 서버 도구입니다. 최소한의 메모리 사용량으로 실행되며 포트, 호스트, 링크 접두사 등의 CLI 옵션을 통해 구성할 수 있습니다.

OpenClawRadar
실시간으로 Claude 사용량을 모니터링하는 무료 macOS 메뉴 바 앱
Tools

실시간으로 Claude 사용량을 모니터링하는 무료 macOS 메뉴 바 앱

한 개발자가 Claude Code와 Opus를 전적으로 사용하여 Claude 사용량을 모니터링하는 무료 macOS 메뉴 바 앱을 구축했습니다. 이 앱은 5시간 및 7일 세션 사용량 바, 컨텍스트 창 채우기 비율을 표시하고 한계에 도달할 때 알림을 보냅니다.

OpenClawRadar
벤치마크 결과, 컨텍스트 엔진이 SWE-bench에서 AI 코딩 에이전트 비용을 3배 절감하는 것으로 나타났습니다.
Tools

벤치마크 결과, 컨텍스트 엔진이 SWE-bench에서 AI 코딩 에이전트 비용을 3배 절감하는 것으로 나타났습니다.

Claude Opus 4.5를 사용한 SWE-bench Verified에서 4가지 코딩 에이전트를 벤치마킹한 결과, 컨텍스트 엔진이 73%의 통과율을 달성하며 작업당 $0.67의 비용이 들었고, 다른 에이전트들은 유사하거나 더 낮은 성능에 작업당 최대 $1.98의 비용이 들었습니다.

OpenClawRadar