클로드 코드를 사용하여 12시간 동안 AI 연구 실험 자동화하기

✍️ OpenClawRadar📅 게시일: February 26, 2026🔗 Source

클로드 코드를 사용하여 12시간 동안 AI 연구 실험 자동화하기

Ad

Claude Code를 활용한 자동화된 AI 연구

한 개발자가 Claude Code를 사용해 12시간 동안 연속으로 AI 연구 실험을 자동화한 과정을 문서화했습니다. 이 프로젝트는 자가 증류를 통해 컨텍스트를 가중치로 이동시키는 실시간 지속 학습 프레임워크인 CLaaS에 초점을 맞췄습니다.

실험 설정

목표는 자가 증류 학습 실행을 튜닝하여 간결한 응답과 이모지 사용 금지와 같은 다양한 선호 검증기에 대한 모델의 준수율을 최대화하는 것이었습니다. 실험은 RTX 5090에서 밤새 로컬로 실행되었습니다.

시스템 아키텍처

저장소는 높은 구성 가능성을 갖도록 구축되었습니다:

Hydra 구성 관리를 통해 CLI로 모든 튜닝 가능한 매개변수 노출
각 학습 단계와 평가 실행을 위한 HTML 대시보드
대시보드를 통해 메트릭, 입력 및 출력 관찰 가능
Claude Code가 curl 요청을 통해 대시보드를 조회하며 진행 상황 확인

실험 관리

워크플로우는 구체적인 규칙이 포함된 로컬 EXPERIMENTS.md 파일로 제어되었습니다:

각 실험은 최대 하나의 변수 변경 또는 하나의 코드 변경만 가능
실험 사이에 모델은 결과에 따라 이전 변경 사항을 수락하거나 되돌려야 함
새로운 코드 변경 사항은 향후 튜닝을 위해 구성으로 노출되어야 함
모델은 진행 상황, 가설 및 결과를 실행 일지로 파일에 기록
선호 준수율 최대화를 목표로 "Ralph Wiggum 루프" 사용

Ad

결과

12시간 동안 시스템은 9개의 실험을 실행했습니다:

첫 실행에서 모델 붕괴 버그 발견 및 수정
배치당 그래디언트 단계를 4로 튜닝
학습률을 3e-5로 튜닝
준수율이 0.000에서 1.000으로 향상
대부분의 시간이 실험 사이의 학습 실행 대기에 소요되어 토큰 사용량이 예상보다 낮음

동일한 작업을 Codex로도 2시간 동안 일반 프롬프트를 사용해 실행했으며, 독립적으로 동일한 하이퍼파라미터에 수렴했습니다.

프로젝트 저장소: https://github.com/kfallah/CLaaS

📖 전체 출처 읽기: r/ClaudeAI

Ad

👀 See Also

Apple Watch 데이터와 MLX를 활용한 맞춤형 건강 코칭을 위해 llama3.2 3B 파인튜닝하기

Apple Watch 데이터와 MLX를 활용한 맞춤형 건강 코칭을 위해 llama3.2 3B 파인튜닝하기

한 개발자가 맥에서 MLX를 사용해 15분 만에 llama3.2 3B를 파인튜닝하여 개인 애플 헬스와 후프 데이터를 분석하는 건강 코치 LLM을 만들었습니다. 이 모델은 일반적인 조언 대신 구체적인 건강 인사이트를 제공하며, 로컬에서 2GB 메모리 사용량으로 실행됩니다.

Mar 2, 2026, 03:45 AM UTC

재귀적 AI 에이전트 시스템이 자체 웹사이트를 구축하고 개선합니다

재귀적 AI 에이전트 시스템이 자체 웹사이트를 구축하고 개선합니다

한 개발자가 Claude Code를 사용하여 웹사이트를 구축했는데, 이 웹사이트는 자체 뉴스레터 콘텐츠를 생성한 다음, 그 콘텐츠를 활용하여 개선이 필요한 부분을 파악하고 개선 백로그를 만듭니다. 이 시스템은 Vercel에 배포된 주간 파이프라인에서 실행됩니다.

Apr 4, 2026, 04:45 AM UTC

제한된 하드웨어에서 Claude Opus 4를 활용한 AI 오케스트레이션

제한된 하드웨어에서 Claude Opus 4를 활용한 AI 오케스트레이션

2014년 Mac Mini에서 Claude API를 활용하여 복잡한 오케스트레이션 작업을 처리하는 추론 엔진으로 Claude Opus 4를 탐구합니다.

Feb 14, 2026, 05:45 AM UTC

OpenClaw, Alexa, 로컬 LLM으로 음성 어시스턴트 구축하기

OpenClaw, Alexa, 로컬 LLM으로 음성 어시스턴트 구축하기

한 개발자가 OpenClaw를 AI 에이전트 백본으로 사용하고, 음성 입력에는 Alexa를, 일반 지식 질의에는 로컬 LLM(Ollama with Qwen 2.5 3B)을 활용하여 1초 미만의 응답 속도와 낮은 API 비용을 달성한 음성 우선 어시스턴트를 구축했습니다.

Mar 1, 2026, 05:45 PM UTC