260개 이상의 AI 에이전트 및 도구 모음집 (오픈소스 및 셀프 호스팅 중심)

대규모로 정리된 AI 개발 도구 모음
한 개발자가 현재 사용 가능한 가장 포괄적인 AI 에이전트 및 프레임워크 목록을 편집했습니다. 이 목록은 오픈소스와 자체 호스팅 옵션을 강조하며, 저장소는 CC0 라이선스를 따르고 추가 항목에 대한 풀 리퀘스트를 받습니다.
주요 카테고리와 도구
목록은 도구를 여러 기능적 카테고리로 구성합니다:
- 로컬 LLM 실행기: Ollama (162k 스타), llama.cpp, vLLM, LM Studio, Jan, LocalAI, GPT4All, Llamafile
- 자체 호스팅 에이전트: OpenClaw (9k에서 188k 스타로 성장 중으로 기록됨), Open WebUI, LibreChat, LobeChat, Anything LLM, DB-GPT
- 오픈소스 프레임워크: Smolagents (HuggingFace), DeerFlow (ByteDance, #1 트렌딩), LangGraph, CrewAI, AutoGen, Mastra
- 에이전트용 오픈 웨이트 모델: Llama 4, Qwen 3 (MCP 네이티브), DeepSeek V3/R1, GLM-4 (가장 낮은 환각 현상으로 설명됨), Gemma 3, Phi-4
- 오픈소스 비디오 생성: Wan 2.1 (자체 호스팅 가능, 제한 없음), HunyuanVideo, LTX Video
- 오픈소스 음성 도구: LiveKit Agents, Rasa, Pipecat, Vocode
- 브라우저 인프라: Browser Use (Manus 내부에서 사용됨), Skyvern, Agent S2
저장소는 벡터 데이터베이스 (Chroma, Qdrant, Milvus, Weaviate), RAG 엔진 (RAGFlow, Pathway), 안전 도구 (NeMo Guardrails, LLM Guard)도 포함합니다.
📖 전체 출처 읽기: r/LocalLLaMA
👀 See Also

Agent-Desktop: 운영체제 접근성 트리를 통한 구조화된 데스크톱 자동화
Agent-desktop은 크로스 플랫폼 CLI(Rust 바이너리, ~15MB)로, OS 접근성 API를 통해 네이티브 앱을 검사하고 조작하기 위한 53개의 명령어를 JSON 출력으로 제공합니다. 스크린샷이나 비전 모델이 필요 없습니다. 프로그레시브 스켈레톤 탐색을 사용하여 Slack이나 VS Code 같은 복잡한 앱에서 토큰 사용량을 78-96%까지 줄입니다.

Google Research, AI 모델 압축을 위한 TurboQuant 소개
Google Research는 정확도 손실 없이 AI 모델 크기를 줄이는 압축 알고리즘 TurboQuant를 소개했습니다. 이는 벡터 양자화에서의 메모리 오버헤드를 해결하고 키-값 캐시 성능을 향상시킵니다.

ClawCut: 로컬 소형 LLM을 OpenClaw와 함께 사용할 수 있게 해주는 Python 프록시
ClawCut은 컨텍스트 중독, 무한 루프, 실패한 크론 작업 출력 등 OpenClaw에 7B/14B 로컬 모델을 연결할 때 발생하는 일반적인 문제를 해결하는 Python Flask 프록시입니다. 도구 호출 중 동적 기억 상실과 예약 작업을 위한 자동 전송을 구현합니다.

CogniLayer: Claude Code용 영구 메모리 MCP 서버
CogniLayer는 SQLite 데이터베이스에 FTS5 전체 텍스트 검색과 벡터 임베딩을 사용하여 Claude Code에 세션 간 지속적인 메모리를 제공하는 오픈소스 MCP 서버입니다. 이는 Claude가 세션 간 프로젝트 컨텍스트를 잊어버리는 문제를 해결합니다.