오픈소스 도구, 로컬 데이터 분석으로 AI 코딩 에이전트 자율성 측정

Codelens-AI의 기능
Codelens-AI는 로컬 Claude Code 세션 파일을 읽고 git 기록과 연관시키는 오픈소스 CLI 도구입니다. 단순히 비용을 추적하는 대신, 사용 패턴을 기반으로 자율성 지표를 계산하여 AI 에이전트가 실제로 어떻게 작동하는지 분석합니다.
주요 지표 및 샘플 결과
제작자가 30일간의 개인 사용 기록에 도구를 실행하여 공유한 결과입니다:
- 오토파일럿 비율: 7.4배 — Claude에 보낸 메시지마다 에이전트가 7가지 작업을 수행함
- 자가 치유 점수: 1% — 6,281개의 bash 명령어 중 테스트나 린트는 단 50개뿐
- 도구 사용 범위: 81% — 에이전트가 대부분의 사용 가능한 도구(grep, read, write, bash, search)를 사용함
- 커밋 속도: 114 단계/커밋 — 하나의 커밋을 생성하는 데 114개의 도구 호출이 필요함
- 전체 자율성 점수: C (36/100)
실제 영향 및 사용법
이 지표들은 에이전트가 열심히 작업하지만(7.4배 오토파일럿 비율), 자신의 작업을 거의 검증하지 않는다는 점(1% 자가 치유 점수)을 드러냈습니다. 이러한 통찰력은 제작자가 프롬프트 전략을 변경하도록 이끌었습니다 — 이제는 Claude에게 매번 수정 후 테스트를 실행하라고 명시적으로 지시하여, 자가 치유 점수를 며칠 만에 1%에서 약 15%로 높였습니다.
설정 및 데이터 개인정보 보호
이 도구는 설정이 필요 없습니다: npx claude-roi. 모든 데이터는 로컬에 유지됩니다 — ~/.claude/projects/의 JSONL 파일과 git 로그를 파싱합니다. 클라우드 구성 요소나 원격 측정이 없습니다.
개발 현황 및 커뮤니티
이 도구는 기능 제안, 이슈, PR을 적극적으로 찾고 있습니다 — 특히 점수 계산 공식과 Cursor/Codex 세션 지원 추가에 관한 것입니다. 제작자는 다른 사람들이 어떤 점수를 얻는지, 그리고 다른 사람들도 이 도구를 실행하고 있는지 궁금해합니다.
GitHub: github.com/Akshat2634/Codelens-AI
웹사이트: https://codelensai-dev.vercel.app/
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

TranscriptionSuite v1.1.2는 WhisperX, NeMo 및 VibeVoice 모델을 추가합니다.
TranscriptionSuite v1.1.2는 이제 세 가지 전사 파이프라인을 제공합니다: PyAnnote 화자 분리를 지원하는 WhisperX, PyAnnote 화자 분리를 지원하는 NeMo 모델(Parakeet 및 Canary), 그리고 내장 화자 분리를 지원하는 VibeVoice 모델입니다. 이 업데이트에는 모델 관리자, 병렬 처리, 단축키 제어, 그리고 VibeVoice를 위한 24kHz 녹음 파이프라인이 포함되어 있습니다.

PinchBench 결과: 최초의 OpenClaw 전용 AI 코딩 에이전트 벤치마크
OpenClaw 전용 첫 벤치마크인 PinchBench은 성공률, 비용, 속도로 32개의 AI 모델을 순위 매겼으며, Google의 Gemini-3-Flash-Preview가 95.1% 성공률에 0.72달러로 선두를 달리고 있습니다.

Werld: 진화하는 신경망을 통한 개방형 인공 생명 시뮬레이션
Werld는 NEAT 신경망을 가진 에이전트들이 하드코딩된 규칙이나 보상 함수 없이 자신의 신경 구조, 감각 처리, 행동을 진화시키는 실시간 인공 생명 시뮬레이션입니다. 시뮬레이션은 64개의 감각 채널, 7개의 연속 모터 기능, 29개의 유전 가능한 게놈 특성을 가진 Watts-Strogatz 소세계 그래프 위에 30개의 에이전트로 시작됩니다.

수행사: 에이전트 내레이션을 침묵시켜 맥락과 토큰을 절약하는 기술
레딧 사용자가 클로드 에이전트 응답에서 서사, 서문, 후문을 제거하는 스킬 'monk'를 게시했으며, 턴당 출력 토큰이 약 54% 감소하고 100회에서 컨텍스트 용량이 29-39% 증가한다고 주장합니다.