0Latency: MCP를 통한 AI 에이전트를 위한 지속적 메모리 계층

0Latency는 Claude와 같은 AI 에이전트에 영구 메모리를 제공하는 MCP(Model Context Protocol) 서버로, 세션 간 컨텍스트 손실이라는 일반적인 문제를 해결합니다. 개발자는 Claude가 30분 전에 내린 결정을 잊어버리는 복잡한 리팩토링 작업 중 컨텍스트 압축을 경험한 후 이를 구축했습니다.
작동 방식
이 도구는 래퍼나 해킹 없이 Claude Desktop, Claude Code 및 claude.ai에 직접 연결됩니다. GPT, Gemini, Cursor 및 모든 MCP 호환 에이전트와 호환됩니다. 작업하는 동안 에이전트가 메모리를 저장하면 이후 세션에서 자동으로 이를 불러와 컨텍스트가 재설정되지 않고 누적되도록 합니다.
개발 및 테스트
개발자는 0Latency가 연결된 Claude Code를 사용하여 나머지 0Latency를 구축했습니다. 이 접근 방식은 중요한 버그를 발견하는 데 도움이 되었습니다: Claude가 "알겠습니다, 저장하겠습니다"라고 말하지만 메모리가 실제로 API에 지속되지 않는 실패 모드로, 사용자가 고장난 제품으로 오해할 수 있는 침묵하는 실패입니다.
테스트에서 시스템은 5시간 세션 동안 15개 이상의 작업을 완료하고 두 번의 컨텍스트 압축이 발생했음에도 메모리를 하나도 잃지 않았습니다.
가격 및 이용 가능성
- 무료 티어: 10K 메모리, 3개 에이전트, 신용카드 불필요
- 유료 플랜에는 30일 환불 보장 포함
- 버그 현상금: 확인된 버그를 찾으면 Pro 3개월 무료 제공(Build With Us 섹션에 세부 정보)
- 개발자는 Pro 무료 한 달 제공과 교환으로 스트레스 테스트를 할 10명을 찾고 있습니다
기술적 세부 사항
0Latency는 0latency.ai에서 이용 가능하며 소스 코드는 GitHub에 있습니다. 개발자는 아키텍처 및 MCP 통합 세부 사항에 대한 질문에 답변할 수 있습니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

인디 개발자, Steam API 데이터 레이어 포함한 전체 게임 스튜디오 사이트를 Claude Code로 배포하다
한 인디 게임 개발자가 터미널을 전혀 열지 않고 Claude Code를 사용하여 게임 스튜디오 웹사이트를 구축하고 배포했습니다. 여기에는 Steam API에서 실시간 정보를 가져오는 데이터 레이어도 포함됩니다.

free-claude-code가 NVIDIA NIM을 통해 GLM-5 지원을 추가하고, OpenRouter와 Discord로 확장되었습니다.
free-claude-code가 이제 NVIDIA NIM의 무료 티어(분당 40회 요청)를 통해 GLM-5를 지원하며, OpenRouter 통합, Discord 봇 지원, LMStudio 로컬 제공자 호환성을 추가했습니다. 이 도구는 Claude Code의 Anthropic API 요청을 대체 모델 백엔드와 작동하도록 변환합니다.

Mengram은 OpenClaw 에이전트에 영구 메모리를 추가합니다.
멍그램은 오픈클로우 에이전트에게 세션 간 장기 기억을 제공하는 오픈소스 메모리 시스템으로, 에이전트가 재시작할 때 모든 것을 잊어버리는 문제를 해결합니다. 이 시스템은 사건, 개체, 절차적 기억을 제공하며 오래되거나 부정확한 사실을 지능적으로 보관합니다.

SMELT 컴파일러는 OpenClaw 작업 공간 토큰 사용량을 최대 95%까지 절감합니다.
SMELT는 OpenClaw 작업공간 마크다운 파일을 더 밀도 높은 런타임 형태로 컴파일하여 AI 모델에 관련 콘텐츠만 전송합니다. 벤치마크 결과, 쿼리당 토큰 사용량이 76.1%에서 95.5%까지 감소했으며, USER.md 및 SOUR.md와 같은 정적 파일을 매 메시지마다 재처리하는 것을 방지합니다.