에이전트캐시: 멀티 에이전트 LLM 프리픽스 캐싱을 위한 파이썬 라이브러리

✍️ OpenClawRadar📅 게시일: April 13, 2026🔗 Source
에이전트캐시: 멀티 에이전트 LLM 프리픽스 캐싱을 위한 파이썬 라이브러리
Ad

agentcache는 접두사 캐싱을 핵심 기능으로 구현하여 멀티 에이전트 LLM 시스템을 최적화하도록 설계된 Python 라이브러리입니다. 이 라이브러리는 CrewAI, AutoGen, open-multi-agent와 같은 프레임워크가 각 작업자마다 새로운 세션을 생성하여 캐시 적중률이 0%가 되고 프롬프트 비용이 중복되는 일반적인 문제를 해결합니다.

작동 방식

라이브러리는 별도의 세션을 생성하는 대신 포크 기반 접근 방식으로 작동합니다:

  • 공유 시스템 프롬프트로 하나의 세션 시작
  • 첫 번째 호출 수행 - 제공자가 접두사를 계산하고 캐시
  • N개의 작업자가 필요할 때, N개의 새 세션을 생성하는 대신 포크
  • 부모 세션: [시스템, 메시지1, 메시지2, ...]
  • 포크된 세션: [시스템, 메시지1, 메시지2, ..., 작업자_작업]
  • 정확히 동일한 접두사 = 캐시 적중

주요 기능

  • 캐시 안전 포크: 작업자 세션 간 동일한 접두사 유지
  • 캐시 중단 감지: 스냅샷을 비교하고 캐시 적중률이 떨어질 때 정확히 무엇이 변경되었는지 보고
  • 캐시 안전 압축: 장기 실행 세션의 경우, 각 호출 전에 이전 도구 출력을 스캔하고 큰 결과를 결정론적 자리 표시자로 대체하여 캐시 가능한 접두사를 유지하면서 더 작은 컨텍스트 유지
  • 매개변수 고정: 포크 전에 캐시 관련 매개변수 고정 (시스템 프롬프트, 모델, 도구, 메시지, 추론 구성)
  • 작업 DAG 스케줄링: 하나의 캐시된 세션에서 병렬 작업자 활성화
Ad

성능 결과

GPT-4o-mini와의 직접 비교 테스트에서 (코디네이터 + 3 작업자, 동일 작업):

  • 텍스트 주입 / 별도 세션: 0% 캐시 적중, 85.7초
  • 접두사 포크: 75.8% 캐시 적중, 37.4초
  • 작업자당 캐시 적중률은 일반적으로 80-99% 범위

설치 및 사용법

pip를 통해 설치:

pip install "git+https://github.com/masteragentcoder/agentcache.git@main"

라이브러리는 GitHub에서 github.com/masteragentcoder/agentcache에서 사용할 수 있습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

컨텍스트-링크 v1.0.0: 로컬 MCP 서버로 Claude Code 토큰 사용량 91% 감소
Tools

컨텍스트-링크 v1.0.0: 로컬 MCP 서버로 Claude Code 토큰 사용량 91% 감소

context-link v1.0.0은 Tree-sitter를 사용하여 코드베이스를 인덱싱하는 로컬 MCP 서버로, Claude에게 필요한 정확한 심볼, 의존성 및 구조만 제공하여 특정 경우에는 토큰 사용량을 91% 줄이고, 전체 작업에서는 70-80% 절감합니다.

OpenClawRadar
카파시의 자율 연구 프로젝트: AI 에이전트가 밤새 LLM 학습 실험을 실행합니다
Tools

카파시의 자율 연구 프로젝트: AI 에이전트가 밤새 LLM 학습 실험을 실행합니다

안드레이 카파시가 최소한의 자동연구 프로젝트를 공개했습니다. 이 프로젝트에서는 AI 에이전트가 train.py를 수정하고, 5분짜리 나노챗 훈련 실험을 실행하며, val_bpb가 개선되었는지 확인한 후, 단일 GPU에서 밤새 이 과정을 반복합니다.

OpenClawRadar
TextForge: LLM 워크플로우를 위한 Claude Code 기반 이메일 승인 도구
Tools

TextForge: LLM 워크플로우를 위한 Claude Code 기반 이메일 승인 도구

한 개발자가 Claude Code를 사용하여 TextForge를 구축하여 이메일 워크플로우에 필수 승인 게이트를 자동화했으며, 명시적인 허가 없이는 LLM이 이메일을 보내지 못하도록 방지했습니다. 이 도구는 Pipedrive CRM과 통합되며 Google CASA2 보안 감사 준수 요구사항을 충족해야 했습니다.

OpenClawRadar
클로드 스킬 관리자, 181개 에이전트 스킬 라이브러리에 대한 피드백 요청
Tools

클로드 스킬 관리자, 181개 에이전트 스킬 라이브러리에 대한 피드백 요청

claude-skills의 관리자인 Reza는 181개의 에이전트 스킬, 250개의 Python 도구, 11개의 AI 코딩 도구에서 작동하는 15개의 에이전트 페르소나를 포함한 오픈소스 라이브러리에 대한 커뮤니티 피드백을 요청하고 있습니다. 그는 분리된 스킬 접근 방식이 효과적인지 의문을 제기하며, 부족한 스킬, 페르소나 기반 에이전트, 도구 통합에 대한 의견을 원합니다.

OpenClawRadar