레딧 사용자가 재시도 루프를 깨기 위해 실패 학습 코딩 에이전트를 실험합니다

r/LocalLLaMA의 한 개발자가 반복적인 재시도 루프에서 벗어나기 위해 실패로부터 학습하는 코딩 에이전트 실험을 진행해 왔습니다. 이 접근법은 실패를 단순히 원시 오류를 기록하는 것이 아니라 재사용 가능한 정보로 취급하는 데 중점을 둡니다.
문제: 실패 루프에 갇힘
개발자는 코딩 에이전트가 종종 실패 → 재시도 → 다시 실패와 같은 실패 패턴에 갇히는 것을 관찰했습니다. 처음에는 모델의 한계로 생각되었지만, 이 문제는 시스템이 왜 실패했는지 추적하지 않는 실패 처리 문제로 보입니다. 재시도할 때 에이전트는 일반적으로 동일한 시도의 변형을 생성하여 약간 다른 방식으로 동일한 실수를 반복합니다.
실험적 접근법
원시 로그를 유지하는 대신, 개발자는 단순화된 '근본 원인'을 저장하고 이전에 작동했던 수정 사항과 짝을 지어 저장하기 시작했습니다. 이후 시도에서는 다시 추측하는 대신 이 저장된 지식과 매칭합니다. 개발자는 이 접근법이 아직 거칠지만 다른 행동을 보인다고 언급합니다: 시스템이 종종 같은 루프에 갇히지 않으며 때로는 실제로 해결책에 수렴합니다.
현재 과제
- 실패를 신뢰성 있게 매칭하는 것은 까다롭습니다
- 시스템이 잘못된 것을 일반화하면 나쁜 수정 사항을 강화할 수 있습니다
- 알려진 수정 사항 재사용과 새로운 수정 사항 탐색 사이의 균형을 어떻게 맞출지 불확실합니다
개발자는 이 접근법에 대한 커뮤니티의 의견과 코딩 에이전트 실패 복구를 개선하기 위해 다른 사람들이 유사한 방법을 시도했는지 여부를 찾고 있습니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Claude Toolbox 확장이 메시지 수준 북마크와 전체 텍스트 검색 기능을 추가했습니다
Claude Toolbox는 Chrome 확장 프로그램으로, 개별 메시지를 북마크하고, 대화 내용 전체를 텍스트 검색하며, TXT 또는 JSON으로 내보낼 수 있습니다. 무료 티어는 2개의 대화를 지원하며, 유료는 월 $5 또는 평생 $49입니다.

Mozilla Thunderbolt: 자체 호스팅 인프라를 위한 오픈소스 기업용 AI 클라이언트
Mozilla는 MPL 2.0 라이선스 하에 조직이 모델 선택, 기업 데이터 통합, 크로스 플랫폼 네이티브 애플리케이션과 함께 자체 호스팅 AI 인프라를 배포할 수 있도록 설계된 오픈소스 AI 클라이언트인 Thunderbolt를 발표했습니다.

스킬 빌: AI 코딩 스킬을 위한 마크다운 기반 거버넌스 프레임워크
한 개발자가 Kotlin, Android/KMP, PHP, Go를 위한 44개의 Markdown 기반 AI 스킬 프레임워크인 Skill Bill을 구축했습니다. 이 프레임워크는 명명법 변화와 중복 로직 같은 프롬프트 관리 문제를 해결하며, 'feature-implement'와 같은 오케스트레이터 스킬이 10-12개의 스킬 호출을 연결하고 Claude Code, Copilot, GLM, Codex와 동기화됩니다.

OmniCoder-9B 파인튜닝은 8GB VRAM 시스템에서 에이전트 코딩에 강력한 성능을 보여줍니다.
레딧 사용자가 Opus 트레이스에서 Qwen3.5-9B를 파인튜닝한 OmniCoder-9B를 OpenCode로 테스트했으며, 8GB VRAM 시스템에서 100k 컨텍스트 길이에 Q4_K_M GGUF 양자화를 사용하여 초당 40개 이상의 토큰 속도를 보고했습니다.