OpenEvol: 대화 기록을 활용한 LLM의 오프라인 자가 개선 파이프라인

✍️ OpenClawRadar📅 게시일: March 31, 2026🔗 Source
OpenEvol: 대화 기록을 활용한 LLM의 오프라인 자가 개선 파이프라인
Ad

OpenEvol의 기능

OpenEvol은 AI 대화 기록을 자동으로 학습 데이터로 변환하는 대규모 언어 모델용 오프라인 자기 개선 파이프라인입니다. 이 도구는 대화에서 가치 높은 교환을 마이닝하고, 품질을 판단하며, 수동 라벨링이나 독점 데이터 플라이휠 없이 미세 조정 데이터셋을 생성합니다.

작동 방식

파이프라인은 네 가지 자동화 단계를 거쳐 실행됩니다:

  • 대화에서 가치 높은 교환 마이닝
  • 선택적 교사 LLM을 사용한 규칙 기반 품질 판단
  • SFT, 선호도, 사전 학습 데이터셋 합성
  • 한 번의 명령으로 미세 조정

이를 통해 모델이 자신의 경험으로부터 학습하는 폐쇄 루프가 생성됩니다.

기술적 세부사항

시작하기 위해 GPU가 필요하지 않습니다. 전체 파이프라인은 모의 또는 OpenAI 호환 교사 백엔드와 함께 CPU에서 실행됩니다. 학습 준비가 되면 GPU를 사용할 수 있습니다.

다섯 가지 교사 백엔드가 지원됩니다:

  • 모의(Mock)
  • 규칙 기반(Rule-based)
  • OpenAI 호환 API (모든 로컬 프록시 작동)
  • HuggingFace Transformers
  • vLLM

사용 옵션

OpenEvol을 사용하는 세 가지 방법:

  • 오프라인 배치 실행을 위한 CLI
  • 자동화를 위한 REST API 서버
  • 채팅에서 직접 파이프라인 실행을 트리거할 수 있는 OpenClaw 데스크톱 플러그인

품질 관리

모든 배치는 자동으로 점수가 매겨집니다. 승인율이 80% 미만으로 떨어지면 학습이 차단되고 인간 검토를 위해 플래그가 지정되어 사용자가 학습에 사용할 데이터를 제어할 수 있습니다.

이러한 유형의 도구는 데이터를 외부 서비스로 전송하지 않고 실제 대화 기록을 사용하여 AI 코딩 에이전트를 개선하려는 개발자에게 유용합니다.

📖 Read the full source: r/openclaw

Ad

👀 See Also

Werld: 진화하는 신경망을 통한 개방형 인공 생명 시뮬레이션
Tools

Werld: 진화하는 신경망을 통한 개방형 인공 생명 시뮬레이션

Werld는 NEAT 신경망을 가진 에이전트들이 하드코딩된 규칙이나 보상 함수 없이 자신의 신경 구조, 감각 처리, 행동을 진화시키는 실시간 인공 생명 시뮬레이션입니다. 시뮬레이션은 64개의 감각 채널, 7개의 연속 모터 기능, 29개의 유전 가능한 게놈 특성을 가진 Watts-Strogatz 소세계 그래프 위에 30개의 에이전트로 시작됩니다.

OpenClawRadar
ZuckerBot MCP 서버는 OpenClaw 에이전트가 메타 광고 캠페인을 실행할 수 있도록 지원합니다.
Tools

ZuckerBot MCP 서버는 OpenClaw 에이전트가 메타 광고 캠페인을 실행할 수 있도록 지원합니다.

ZuckerBot은 OpenClaw 에이전트가 메타 광고를 직접 제어할 수 있도록 하는 MCP 서버로, 인간의 개입 없이도 전체 캠페인 루프를 실행할 수 있게 해줍니다. 현재 50개 이상의 고유 에이전트가 이를 사용하여 경쟁사 광고를 수집하고, 타겟팅을 생성하며, 캠페인을 시작하고, 코드에서 성능을 조정하고 있습니다.

OpenClawRadar
노트북LM MCP 구조화: 무료 서버가 클로드를 노트북LM에 자동 프롬프트 구조화로 연결합니다
Tools

노트북LM MCP 구조화: 무료 서버가 클로드를 노트북LM에 자동 프롬프트 구조화로 연결합니다

NotebookLM MCP Structured라는 무료 MCP 서버는 Claude Desktop을 NotebookLM 노트북에 자동 프롬프트 구조화로 연결합니다. 이 서버는 질문 유형(비교, 목록, 분석, 설명, 추출)에 따라 쿼리를 재구성하고 완전성 검사 및 정확성 제약 조건을 추가합니다.

OpenClawRadar
PRECC 도구, 사전 도구 호출 압축으로 Claude 코드 API 비용 절감
Tools

PRECC 도구, 사전 도구 호출 압축으로 Claude 코드 API 비용 절감

한 개발자가 PRECC라는 오픈 소스 도구를 개발했습니다. 이 도구는 Claude Code 도구 호출을 가로채고 RTK(Redundancy-aware Token Kompression)를 사용하여 페이로드를 압축합니다. 이를 통해 입력 토큰을 40-66% 줄이면서도 지각 가능한 지연 시간 영향을 주지 않습니다.

OpenClawRadar