에이전트 팩토리: 온라인 문제 토론에서 AI 에이전트를 구축하는 자율 시스템

에이전트 팩토리는 온라인 토론에서 실제 문제를 식별하여 AI 에이전트를 구축하는 자율 시스템입니다. Andrej Karpathy의 자동 연구 패턴에서 영감을 받아, ML 최적화가 아닌 아이디어 생성에 '밤새 실험을 실행하고, 효과가 있는 것은 유지하며, 효과가 없는 것은 버리는' 동일한 접근 방식을 적용합니다.
작동 방식
이 시스템은 Reddit, Hacker News, GitHub, Twitter에서 사람들이 온라인에서 논의하는 실제 문제를 수집합니다. 각 잠재적 아이디어를 세 가지 기준(수요, 시장 격차, 실행 가능성)으로 평가합니다. 아이디어가 품질 기준을 통과하면, 시스템은 자동으로 독립형 AI 에이전트를 구축하고 작동을 검증한 후 커밋합니다. 기준은 각 구축마다 점진적으로 높아져 점점 더 나은 아이디어를 요구합니다.
실제 구현
이 프로젝트는 세 가지 핵심 파일로 구성됩니다:
program.md- Claude Code에게 어디서 연구할지와 어떤 품질 기준을 충족해야 하는지 알려줍니다seed/- 7개의 도구가 포함된 최소한의 Next.js 템플릿run.sh- Claude Code를 헤드리스 모드로 실행하고 컨텍스트 제한 시 자동 재시작합니다
이 시스템은 TypeScript로 구축되었으며, MIT 라이선스를 사용하고 OpenRouter 또는 Ollama에서 실행됩니다. 특히 LangChain 및 CrewAI 프레임워크를 피합니다. 생성된 각 에이전트는 독립적이며 복제하여 독립적으로 실행할 수 있습니다.
예시 출력
첫 번째 세션에서 시스템은 다음과 같은 20개의 에이전트를 생성했습니다:
freelancer-deduction-finder- 프리랜서가 놓친 세금 공제에 대해 질문하는 경우wage-rights-advisor- 초과 근무 면제에 대해 혼란스러워하는 사람들을 위한data-broker-opt-out- 데이터 브로커 옵트아웃에 압도된 사람들을 위한
품질 검증
시스템은 각 에이전트를 부팅하고 테스트 프롬프트를 전송한 후 출력이 유용한지 확인합니다. 그러나 창작자는 이들이 MVP이며 일부는 거칠다는 점을 인정합니다. 주요 목적은 아이디어 생성입니다. 창작자는 매일 아침 배송된 에이전트를 검토하고 가장 유망한 것을 실제 프로젝트로 추가 개발하기 위해 선택합니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

로컬에서 실행되는 Gemma 4 26B A4B용 싱글 페이지 챗봇 인터페이스
한 개발자가 Gemma 4 26B A4B를 로컬에서 실행하며 작동하도록 설계된 단일 페이지 HTML 챗봇 인터페이스를 만들었습니다. 이 구현은 LM Studio의 API에 연결하고 단일 HTML 파일 내에서 완전한 챗봇 인터페이스를 제공합니다.

YourMemory: 생물학적 감쇠를 갖춘 AI 메모리, LoCoMo-10에서 59% 재현율 달성
YourMemory는 Ebbinghaus 망각 곡선과 그래프 기반 검색을 사용하여 AI 에이전트에 지속적인 메모리를 제공합니다. LoCoMo-10에서 Recall@5 59%로 벤치마크되었으며, Zep Cloud보다 2배 우수합니다.

Engramx v3.4: MCP 서버 + SQLite 지식 그래프로 클로드 코드 토큰 사용량 89% 감소
Engramx v3.4는 Claude Code 에이전트의 파일 읽기를 가로채 원시 콘텐츠 대신 구조적 요약을 반환합니다. 벤치마크 결과 87개 파일 코드베이스에서 총 89.1%의 토큰 감소를 보였습니다.

마크다운으로 작성된 200개 이상의 앱 디자인 명세서 – 클로드나 커서에 드래그하면 정확한 UI 클론 생성
200개 이상의 인기 앱을 구조화된 마크다운 디자인 명세서로 정리한 라이브러리입니다. 정확한 16진수 색상 코드, 타이포그래피 스케일, 간격, 모든 화면 상태 및 탐색 그래프를 포함합니다. Claude, Cursor 또는 모든 AI 에이전트에 넣으면 색상이나 간격을 추측하지 않고 SwiftUI, Jetpack Compose 또는 Expo UI 클론을 생성할 수 있습니다.