Skillware는 로컬 모델 파인튜닝을 위해 엔트로피 점수를 포함한 합성 데이터 생성기를 추가합니다.

Skillware는 일반적인 합성 데이터가 모델 붕괴로 이어지는 문제를 해결하면서 로컬 모델 파인튜닝을 위해 특별히 설계된 새로운 합성 데이터 생성기 스킬을 라이브러리에 추가했습니다.
주요 기능
이 도구에는 다음과 같은 구체적인 기능들이 포함되어 있습니다:
- 엔트로피 점수화: 저장 전에 출력의 다양성을 수학적으로 점수화하기 위해 zlib 압축률 휴리스틱을 사용합니다. 이를 통해 모델 붕괴에 기여할 수 있는 낮은 엔트로피 데이터를 식별하고 필터링하는 데 도움이 됩니다.
- 로컬 준비 완료: 로컬 모델 통합을 위해 Ollama와 즉시 사용 가능합니다. 필요할 때 고수준 추론 배치를 생성하기 위해 Gemini 및 Anthropic 모델도 지원합니다.
- 구조화된 출력: .jsonl 파인튜닝 파이프라인에 특화된 완벽한 JSON 배치를 생성하여 훈련 워크플로우에서 즉시 사용할 수 있도록 합니다.
해결된 문제
이 도구는 일반적인 합성 데이터가 파인튜닝 중에 모델이 "자기 자신을 따라 말하게" 만드는 문제, 즉 모델 붕괴로 알려진 현상을 특별히 대상으로 합니다. 저장 전에 출력 다양성을 점수화함으로써 훈련 데이터가 충분한 변이를 유지하도록 돕습니다.
소스에 따르면 이는 로컬 모델을 사용하며 파인튜닝 작업을 위한 더 나은 합성 데이터 생성이 필요한 개발자들을 위해 사용 가능한 Skillware 라이브러리의 새로운 추가 기능입니다.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

Fehu: Claude AI MCP 통합을 지원하는 CLI 복식 부기 시스템
Fehu는 MCP를 통해 Claude AI에 연결되는 경량 CLI 개인 회계 도구로, SQLite 기반의 복식 부기 시스템을 통해 자연어 거래 기록이 가능합니다. 계층적 계정 구조, 해시태그를 이용한 자동 태깅, 강력한 계산 엔진, 다중 통화 지원 등의 기능을 갖추고 있습니다.

로컬 대시보드에서 Claude Code 사용량을 토큰 비용, 도구 호출 및 세션 분석과 함께 추적합니다.
한 개발자가 Claude Code의 JSONL 세션 파일을 읽어 토큰 사용량, 예상 비용, 도구 호출 분석, 세션 기록을 시각화하는 로컬 대시보드를 구축했습니다. 이 도구는 Express API와 React 대시보드로 완전히 사용자의 컴퓨터에서 실행됩니다.

Manifest는 이제 API 키 없이 Claude Pro/Max 구독을 지원합니다
오픈소스 라우팅 레이어인 Manifest는 이제 API 키 없이도 Claude Pro 또는 Max 구독을 직접 연결할 수 있도록 지원합니다. API 키가 있는 사용자는 구독 요금제 한도에 도달했을 때 폴백 라우팅을 구성할 수 있습니다.

OpenClaw 모델 성능 검토: Codex 5.3 선두, GLM 모델 실망
한 개발자가 여러 AI 모델을 OpenClaw로 테스트한 결과, Codex 5.3이 9/10점으로 가장 우수한 성능을 보였으며, GLM 4.7과 GLM 5는 높은 토큰 사용량, 느린 응답 속도, 일관성 없는 출력으로 인해 5/10점을 받았습니다.