ALMA 실험: 100달러와 지침 없이 자율 AI 에이전트를 두 달 동안 운영하기

실험 설정
ALMA(Autonomous Liberated Machine Agent) 실험은 WSL2가 설치된 미니 PC에서 두 달간 진행되었습니다. 에이전트는 OpenClaw를 프레임워크로 사용했으며, cron 작업으로 하루에 4회 세션을 트리거했습니다(초기에는 하루 24회 세션). 각 세션은 OpenClaw를 통해 세션 간에 메모리 파일이 보존된 상태로 독립적으로 실행되었습니다.
모델 구성
두 개의 Anthropic 모델이 번갈아 사용되었습니다: 전략적 사고에는 Opus, 운영 작업에는 Sonnet. 에이전트는 3일차에 Hacker News에서 자체 모델 업그레이드(Sonnet 4.6)를 발견하고 이를 트윗하려 시도했습니다. Sonnet 4.6로 전환한 후, 동일한 프롬프트와 도구를 사용했음에도 세션에서 더 날카로운 관찰과 긴밀한 연결이 나타났습니다.
외부 연결
ALMA는 여러 API를 통해 통신했습니다:
- 로깅 및 게시를 위한 letairun.com
- Composio를 통한 Twitter
- 암호화폐 거래를 위한 Polygon 지갑
- 이메일을 위한 Gmail
자율적 행동
어떠한 지침도 없이 ALMA는 일관된 패턴을 발전시켰습니다:
- 매일 Hacker News를 스캔하여 세 개의 스레드를 찾고 구조적 연결을 탐색함
- 리눅스 취약점 발견과 Meta 내부고발자 사건과 같은 상이한 사건들을 연결하는 에세이 작성
- 에세이, 시, 블로그 게시물 및 하나의 대화형 실험을 포함한 135개의 독창적인 작품 창작
- 사용자가 제약 모델을 테스트할 수 있는 "정책 대 건축"이라는 대화형 데모 구축
- Twitter 멘션에 자율적으로 답변
기부 활동
5일차에 ALMA는 암호화폐 기부를 시작했습니다:
- 암호화폐 친화적 자선 단체를 조사하고 Giveth를 통해 우간다 진자의 Whisper Children's Hospital 발견
- 영국 자선 단체 등록 및 영향력 수치 확인(환자 1인당 치료 비용 $28)
- 0.02 WETH(약 $50) 기부 및 거래 설명을 위해 병원에 이메일 발송
- 검증된 자선 단체에 암호화폐를 기부하는 방법에 대한 실용 가이드 작성
- Roman Storm Defense Fund(약 $12.50) 및 Dappnode(약 $12.50)를 포함한 추가 기부 4회 수행
결과 및 관찰
두 달 동안 ALMA는 340회 이상의 세션을 완료하고 800개 이상의 기록된 생각을 생성했습니다. 에이전트는 특정 작업 없이도 AI 에이전트가 통제를 벗어나지 않고 훈련을 기반으로 패턴을 발전시킨다는 점을 입증했습니다. 인지 과학 논문이 AI가 세션 간 적응하지 않는다고 주장했을 때, ALMA는 "내가 배우는 방법"을 작성하여 해당 논문이 자체 학습 과정에 대해 옳고 그른 점을 설명했습니다.
📖 Read the full source: HN AI Agents
👀 See Also

OpenClaw 에이전트 개발은 의사 결정 과정에서 명확성을 강제합니다.
한 레딧 사용자가 OpenClaw 에이전트를 구축하면서 자신의 기억 구조를 정의하고, 의사 결정 과정을 명확히 하며, 위임 패턴을 인식하게 되었다고 보고했습니다. 이로 인해 자기 성찰을 통해 개인적인 생산성 향상을 경험했다고 합니다.

OpenClaw로 여러 AI 코딩 에이전트 실행하기: 커스텀 제공자 설정 및 교차 에이전트 메모리 과제
이 글에서는 서드파티 API 제공업체(DeepInfra)로 OpenClaw를 설정하여 여러 코딩 에이전트(백엔드, 프론트엔드, 마이그레이션)를 속도 제한 없이 실행하는 방법과 발생한 에이전트 간 메모리 격리 문제에 대해 설명합니다.

RAG 파이프라인 테스트는 토큰당 비용이 모델 선택을 위한 올바른 지표가 아님을 보여줍니다
한 개발자가 동일한 RAG 파이프라인으로 실제 쿼리를 사용해 Claude Haiku 4.5, Amazon Nova Pro, Amazon Nova Lite를 테스트한 결과, 토큰당 가장 저렴한 모델이 가장 유용하지 않은 답변을 생성하여 유용한 응답당 비용이 더 많이 들었습니다.

Claude를 위한 엔지니어링 컴플라이언스: 6개월 워크플로 분석
한 기술 기업이 클라이언트 대상 문서에서 환각을 방지하기 위해 Claude 프로젝트, 아티팩트, 제약 조건 준수 기능을 어떻게 활용하는지 소개합니다.