에이전트 프레임워크는 세션당 35만 개 이상의 토큰을 정적 파일 재전송에 낭비합니다.

✍️ OpenClawRadar📅 게시일: April 13, 2026🔗 Source
에이전트 프레임워크는 세션당 35만 개 이상의 토큰을 정적 파일 재전송에 낭비합니다.
Ad

토큰 낭비 벤치마크 결과

로컬 Qwen 3.5 122B 설정에서 수행한 측정 결과, 에이전트 프레임워크가 정적 파일을 반복적으로 재전송함으로써 세션당 350,000개 이상의 토큰을 낭비하는 것으로 나타났습니다. 출처에서는 이 수치를 "비현실적"이라고 설명합니다.

최적화 접근법

컴파일 타임 접근법을 통해 쿼리 컨텍스트를 1,373개 토큰에서 단 73개 토큰으로 줄일 수 있는 방법이 발견되었습니다. 이는 해당 컨텍스트에서 토큰 사용량을 95% 감소시킨 것을 의미합니다.

벤치마크에서는 또한 단순한 JSON 변환이 문제를 30% 더 악화시켜, 토큰 낭비가 기준 측정치를 초과하여 증가한다는 사실도 발견되었습니다.

기술적 배경

에이전트 프레임워크는 일반적으로 시스템 프롬프트, 도구 정의 및 세션 내 여러 상호작용에서 정적으로 유지되는 기타 구성 데이터를 포함합니다. 이 데이터가 모든 쿼리마다 재전송되면 모델에 새로운 정보를 제공하지 않으면서 토큰을 소비하게 됩니다. 이는 Qwen 3.5 122B와 같은 대형 모델에서 특히 비용이 많이 드는데, 토큰 처리가 성능과 비용에 직접적인 영향을 미치기 때문입니다.

컴파일 타임 접근법은 정적 요소를 재전송하는 대신 참조할 수 있도록 사전 처리하는 것을 포함할 가능성이 높으며, 이는 현대 웹 애플리케이션이 정적 자산을 캐시하는 방식과 유사합니다. AI 코딩 에이전트를 사용하는 개발자들에게 이 오버헤드를 줄이는 것은 응답 시간을 크게 개선하고 운영 비용을 절감할 수 있습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

LiveDocs 탐색: AI 네이티브 데이터 분석 노트북
Tools

LiveDocs 탐색: AI 네이티브 데이터 분석 노트북

LiveDocs는 데이터 팀이 다단계 분석을 수행하고 AI 에이전트의 도움으로 분석을 처음부터 끝까지 유지할 수 있는 반응형 노트북 환경을 제공합니다.

OpenClawRadar
Rivet Actors가 SQLite 저장소를 추가했습니다: 에이전트, 테넌트 또는 문서별로 하나의 데이터베이스를 제공합니다.
Tools

Rivet Actors가 SQLite 저장소를 추가했습니다: 에이전트, 테넌트 또는 문서별로 하나의 데이터베이스를 제공합니다.

Rivet Actors는 이제 각 액터가 자체 SQLite 데이터베이스를 갖는 SQLite 스토리지를 지원하여, AI 에이전트, 멀티테넌트 SaaS, 협업 문서 또는 사용자별 격리를 위한 수백만 개의 독립적인 데이터베이스를 가능하게 합니다.

OpenClawRadar
스킬 스캐폴더: 코드 작성 없이 OpenClaw 스킬 구축하기
Tools

스킬 스캐폴더: 코드 작성 없이 OpenClaw 스킬 구축하기

Skill Scaffolder는 사용자가 일반 영어로 원하는 내용을 설명하여 OpenClaw 스킬을 만들 수 있게 해주는 오픈소스 도구입니다. YAML, Python 또는 설정 파일 없이도 전체 프로세스(사용자 인터뷰, 스킬 파일 작성, 테스트 및 설치)를 처리합니다.

OpenClawRadar
다중 에이전트 토론 접근법이 LLM 추론 품질을 향상시킵니다
Tools

다중 에이전트 토론 접근법이 LLM 추론 품질을 향상시킵니다

한 개발자가 CyrcloAI를 사용하여 다중 에이전트 토론 방식을 실험했습니다. 이 방식에서는 분석가, 비평가, 종합자 등 다양한 역할을 맡은 AI 에이전트들이 최종 답변을 내놓기 전에 서로의 응답을 비판하며, 더 구조화되고 신중한 결과물을 만들어냈습니다.

OpenClawRadar