오픈 소스 지식 베이스 서버 및 지속적 AI 메모리를 위한 멀티 에이전트 오케스트레이터

한 개발자가 AI 코딩 에이전트가 세션 간에 지속적인 메모리를 유지할 수 있도록 하는 시스템을 오픈소스로 공개했습니다. 이를 통해 대화 간에 수동으로 컨텍스트를 복사-붙여넣기할 필요가 없어집니다. 이 설정은 개인 VPS에서 실행되는 맞춤형 Model Context Protocol(MCP) 서버를 통해 Claude.ai와 Claude Code를 연결합니다.
아키텍처 및 구성 요소
이 시스템은 두 가지 주요 오픈소스 프로젝트로 구성됩니다:
- 지식 베이스 서버: 중앙 두뇌 역할을 하며 Node.js, SQLite FTS5, Express 및 Obsidian Sync로 구축되었습니다. Obsidian 볼트와 Claude의 메모리 디렉토리를 수집하여 순위가 매겨진 결과와 강조된 스니펫이 포함된 전체 텍스트 검색을 제공합니다.
- 에이전트 오케스트레이터 (Daniel): Claude, Codex, Gemini CLI를 래핑하여 세 에이전트 모두가 동일한 지식 베이스를 공유할 수 있도록 하고, 한 에이전트가 속도 제한에 도달하거나 다운될 때 자동 장애 조치를 제공합니다.
주요 기능
- 네 가지 MCP 도구:
kb_search,kb_list,kb_read,kb_ingest - 수동 문서 관리를 위한 웹 대시보드
- CLI 명령어:
kb start,kb ingest,kb search,kb register - 자체 학습 기능: AI가 세션 결과를 기반으로 자체
CLAUDE.md지시 파일을 자동으로 업데이트합니다 - 컨텍스트 드리프트를 방지하기 위한 3계층 저장소(콜드/핫/장기)
- 다운타임 중 컨텍스트 손실 없이 다중 에이전트 장애 조치
기술 구현
이 기술 스택은 벡터 데이터베이스와 클라우드 의존성을 피하고, 토큰 최적화 검색을 위해 SQLite FTS5를 사용합니다. 워크플로우는 다음 경로를 따릅니다: Obsidian 볼트(인간 큐레이션) → KB 서버(SQLite FTS5) → MCP 인터페이스 → Claude Code/Codex/Gemini(모두 동일한 두뇌 공유).
이 시스템에는 AI 에이전트가 읽도록 특별히 작성된 EXTENDING.md 파일이 포함되어 있어, 사용자가 에이전트에게 "EXTENDING.md를 읽고 내 설정에 맞게 맞춤화하라"고 지시하여 자동 구성이 가능합니다.
Claude Code 다운타임 중 실제 테스트에서, 오케스트레이터는 자동으로 Codex로 라우팅했으며, Codex는 VPS에 SSH로 접속하여 KB 서버를 진단하고 복구 명령어를 제공했습니다. 이 모든 과정이 Termux를 통해 휴대폰에서 접근 가능했으며 컨텍스트는 전혀 손실되지 않았습니다.
개발자는 이 시스템을 프로덕션에서 세 개의 프리미엄 AI 에이전트와 함께 월 약 $60의 비용으로 운영 중이며, 100회 이상의 세션에 걸쳐 컨텍스트를 축적하여 학습된 코드베이스 패턴과 선호도를 기반으로 한 번에 깔끔한 코드 생성을 가능하게 하고 있다고 보고했습니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

Apple Silicon에서의 긴 대화를 위한 KV 캐시 재사용으로 200배 속도 향상 달성
한 개발자가 Apple의 MLX 프레임워크를 사용하여 로컬 LLM 추론을 위한 세션 기반 KV 캐시 재사용을 구현했으며, 100K 컨텍스트 길이에서 첫 토큰까지의 시간을 200배 개선했습니다. 이 접근 방식은 대화 턴 간에 KV 캐시를 메모리에 유지하고 새로운 토큰만 처리합니다.

Aionic Anthology 소개: Claude의 AI 작업을 구조화하는 프레임워크
Aionic Anthology 프레임워크는 Claude의 AI 작업을 컨텍스트를 범주별로 분리하고 위험 평가 시스템을 추가하여 작업 실행을 개선하는 방식으로 구성합니다.

코딩-플래시카드: Rust, SQLite, Godot, Wolfram 언어를 위한 800개 이상의 Anki 카드
Rust, SQLite, Godot, Wolfram Language를 처음부터 학습할 수 있는 800개 이상의 마크다운 플래시카드, Anki 덱 또는 PDF로 변환하는 스크립트 포함

Squeez 도구는 Claude Code 컨텍스트 창을 확장하기 위해 bash 출력을 90% 이상 압축합니다.
Squeez는 ps aux, docker logs, git log와 같은 원시 bash 출력이 Claude Code에 도달하기 전에 자동으로 압축하는 훅입니다. 19개의 일반적인 명령어에서 평균 92.8%의 토큰 사용량을 줄여 세션이 더 오래 지속되도록 돕습니다.