Anthropic의 클로드 코드 품질 향상을 위한 다중 에이전트 하네스 설계

✍️ OpenClawRadar📅 게시일: March 29, 2026🔗 Source
Anthropic의 클로드 코드 품질 향상을 위한 다중 에이전트 하네스 설계
Ad

Anthropic은 장기간 실행되는 코딩 작업에서 Claude의 성능을 향상시키기 위한 하네스 설계 접근법을 설명하는 블로그 게시물을 발표했습니다. 이 방법은 두 가지 구체적인 문제를 해결합니다: 컨텍스트 불안(장기간에 걸친 일관성 상실)과 자기 평가 편향(품질이 낮은 경우에도 Claude가 자신의 작업을 칭찬하는 경향).

다중 에이전트 솔루션

이 솔루션은 GAN(생성적 적대 신경망)에서 영감을 얻어 함께 작동하는 여러 에이전트를 구현합니다. 핵심 구조는 다음과 같습니다:

  • 생성자: 코드와 디자인을 생성
  • 평가자: 비판적 평가와 피드백 제공

프론트엔드 구현

프론트엔드 개발을 위해 하네스는 일반적인 디자인을 피하고 미학과 창의성을 강조하는 4가지 평가 기준을 사용합니다. 이 과정은 5~15회의 수정을 포함하며, 더 아름답고 독특한 결과물을 만들어냅니다.

풀스택 구현

풀스택 개발을 위해 하네스는 3가지 에이전트를 사용합니다:

  • 플래너
  • 생성자
  • 평가자

성능 비교

이 글은 동일한 게임 개발 요구사항에 대한 결과를 비교합니다:

  • 단독 실행: 빠른 실행 속도이지만 게임에 심각한 버그 존재
  • 하네스 사용: 더 많은 시간과 비용이 소요되지만, 아름다운 인터페이스, 플레이 가능한 게임, 추가된 AI 지원을 포함해 상당히 높은 품질의 결과물 생성

이 글은 모델이 더 강력해짐에 따라(특히 Opus 4.6을 언급하며) 불필요한 하네스 요소는 제거되어야 한다고 제안합니다.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Claude-Code v2.1.76은 MCP(Multi-Context Prompting) 유도 기능 추가, 작업 트리 최적화, 그리고 수많은 버그 수정을 포함합니다.
Tools

Claude-Code v2.1.76은 MCP(Multi-Context Prompting) 유도 기능 추가, 작업 트리 최적화, 그리고 수많은 버그 수정을 포함합니다.

Claude-Code v2.1.76는 작업 중간에 구조화된 입력을 위한 MCP 요청 지원을 도입하고, 모노레포 효율성을 위한 worktree.sparsePaths를 추가하며, 지연된 도구 스키마 손실, 슬래시 명령어 문제, Remote Control 세션 안정성을 포함한 20개 이상의 문제를 수정했습니다.

OpenClawRadar
OpenClaw의 보안, 비용, 복잡성 문제를 해결하는 여섯 가지 오픈소스 도구
Tools

OpenClaw의 보안, 비용, 복잡성 문제를 해결하는 여섯 가지 오픈소스 도구

한 개발자가 Cisco가 지적한 OpenClaw의 보안 취약점, 급증하는 비용, 복잡한 설정을 해결하기 위해 6가지 커뮤니티 도구를 테스트했습니다. ClawSec는 보안 스캔과 무결성 검증을 제공하고, Antfarm은 결정론적 멀티 에이전트 워크플로우를 가능하게 하며, LanceDB Pro는 하이브리드 벡터 검색으로 메모리 검색을 개선합니다.

OpenClawRadar
3주 만에 개발한 솔로 개발자의 크로스 플랫폼 AI 에이전트, 40개국 이상 출시
Tools

3주 만에 개발한 솔로 개발자의 크로스 플랫폼 AI 에이전트, 40개국 이상 출시

한 명의 독립 개발자가 Skales를 만들었습니다. 네이티브 데스크톱 AI 에이전트로 139개 이상의 도구와 원격 제어용 모바일 동반 앱을 갖추고 있으며, Claude를 사용해 단 3주 만에 완성했습니다. 이 앱은 macOS, Windows, Linux에서 실행되며, 로컬 우선이고 무료이며, 이미 40개 이상의 국가에서 활성 사용자를 보유하고 있습니다.

OpenClawRadar
클로드 옥토퍼스 v8.48: 개발 워크플로우를 위한 다중 AI 오케스트레이션 플러그인
Tools

클로드 옥토퍼스 v8.48: 개발 워크플로우를 위한 다중 AI 오케스트레이션 플러그인

Claude Octopus v8.48는 Claude, Codex, Gemini AI 모델을 병렬로 실행하며 개발 단계별로 고유한 역할을 부여하는 오픈소스 플러그인입니다. 단계 간 75% 합의 게이트, 복잡한 작업을 위한 새로운 컨텍스트 창, /octo:embrace와 같은 전체 개발 수명 주기 명령어를 포함합니다.

OpenClawRadar