CAL: LLM 에이전트를 위한 오픈소스 컨텍스트 최적화 레이어

✍️ OpenClawRadar📅 게시일: April 15, 2026🔗 Source

CAL: LLM 에이전트를 위한 오픈소스 컨텍스트 최적화 레이어

Ad

CAL의 기능

CAL은 기존 코드와 LLM API 호출 사이에 위치하여 각 요청에 대한 컨텍스트를 지능적으로 선택, 압축 및 조립하는 Python 라이브러리입니다. 토큰 사용량이 많은 에이전트 설정에서 발생하는 비용 및 컨텍스트 문제를 해결하며, 특히 최근 Claude Pro/Max 구독 변경과 관련이 있습니다.

성능 벤치마크

Claude Opus 4와 103개의 컨텍스트 청크를 사용한 실제 운영 환경에서:

CAL 없음: 모든 요청에서 103개 청크 전체(~23,000 토큰) 전송, 요청당 $0.043
CAL 사용: ~6개 청크와 4,100 토큰으로 감소, 요청당 $0.008
결과: 토큰 83% 감소, 비용 81% 감소

5,000개의 WildChat 프롬프트(57개 언어의 실제 LLM 대화를 담은 오픈 아카데믹 데이터셋)로 검증, 평균 97.6% 절감 효과.

주요 기능

선택기: IDF 가중치 점수 기반으로 쿼리별 관련 청크만 선택. 안정적인 접두사 + 요청별 동적 청크 선택 사용.
도구 스텁: 3단계 지연 로딩 도구 시스템으로, 모델이 특정 도구 사용 의사를 나타낼 때까지 경량 스텁 유지.
비용 엔진: Anthropic의 4가지 입력 계층과 Google의 캐시 저장소 가격을 인지하는 공급자 인식 절감 계산기.
노이즈 억제: IDF 하한값 + require-any 게이트로 일반적인 단어가 모든 요청에서 관련 없는 청크를 로드하는 것을 방지.
캐시 안정적 순서: 선택에는 점수만 사용, 위치는 알파벳 순서로 유지하여 캐시 히트율 유지.

Ad

기술적 세부사항

다중 턴 컨텍스트 처리: 도구 스텁은 기록을 인식합니다. 모델이 이전 턴에서 도구를 사용한 경우, 전체 스키마가 로드된 상태로 유지되어 대화 연속성을 유지합니다.

공급자 지원: CAL은 공급자에 구애받지 않으며 채팅 완료 엔드포인트가 있는 모든 공급자와 작동합니다. 비용 엔진은 이미 Anthropic의 4가지 입력 계층과 Google의 캐시 저장소 가격을 처리합니다.

예외 상황: 모호한 쿼리에 대해 IDF 하한값과 노이즈 억제 사용. 하이브리드 키워드+의미적 점수 부여는 로드맵에 포함.

설치 및 라이선스

pip install cal-context

MIT 라이선스. PyPI: https://pypi.org/project/cal-context/

GitHub: https://github.com/vjc-lab/context-assembly-layer

📖 Read the full source: r/openclaw

Ad

👀 See Also

DoomVLM: 둠 데스매치에서 비전 언어 모델 테스트를 위한 오픈 소스 도구

DoomVLM: 둠 데스매치에서 비전 언어 모델 테스트를 위한 오픈 소스 도구

DoomVLM은 이제 단일 Jupyter 노트북으로 오픈 소스화되어 OpenAI 호환 API를 통해 비전 언어 모델이 Doom을 플레이하는 것을 테스트할 수 있게 되었습니다. 이 도구는 최대 4개의 모델이 경쟁할 수 있는 데스매치 모드를 지원하며, 시스템 프롬프트, 도구 설명 및 샘플링 매개변수에 대한 완전한 구성 옵션을 제공합니다.

Mar 14, 2026, 06:45 AM UTC

OnPrem.LLM 에이전트 실행기: 내장 도구를 갖춘 샌드박스 AI 에이전트 실행하기

OnPrem.LLM 에이전트 실행기: 내장 도구를 갖춘 샌드박스 AI 에이전트 실행하기

OnPrem.LLM의 AgentExecutor를 사용하면 파일 작업, 셸 명령어, 웹 검색을 포함한 9가지 내장 도구를 활용해 클라우드 또는 로컬 모델을 사용하여 복잡한 작업을 실행하는 자율 AI 에이전트를 생성할 수 있습니다. 보안을 위해 샌드박스 컨테이너에서 에이전트를 실행할 수 있습니다.

Mar 20, 2026, 03:45 PM UTC

클로드 코드 스킬이 스티치 디자인을 제로 픽셀 드리프트로 Next.js로 변환합니다

클로드 코드 스킬이 스티치 디자인을 제로 픽셀 드리프트로 Next.js로 변환합니다

Claude Code 스킬은 Google Stitch AI 디자인을 Next.js 컴포넌트로 변환하며, 픽셀 드리프트를 방지하기 위한 필수 검증 체크포인트를 포함하여 정확한 값을 보존하고 에셋을 처리합니다.

Apr 13, 2026, 08:45 PM UTC

RepoLens: Go로 작성된 인터랙티브 로컬 코드베이스 패커 및 토큰 최적화 도구(TUI/CLI)

RepoLens: Go로 작성된 인터랙티브 로컬 코드베이스 패커 및 토큰 최적화 도구(TUI/CLI)

RepoLens은 의존성 없는 Go 도구로, TUI 파일 탐색기, 실시간 토큰 카운터, 주석 제거, 비밀 스캐너, 토큰 기반 파일 분할을 통해 리포지토리를 LLM 컨텍스트로 패킹합니다.

Jul 2, 2026, 12:17 AM UTC