Qwen3.x 모델은 스트리밍 출력 형식 불일치로 인해 OpenClaw에서 조용히 실패합니다.

문제점
OpenClaw와 함께 로컬에서 Qwen3.x 모델을 스트리밍 모드로 실행할 때, 모델이 예상된 content 필드 대신 reasoning 필드에 응답을 출력합니다. OpenClaw는 빈 콘텐츠를 실패로 해석하고 오류를 발생시키지 않은 채 대체 체인의 다음 모델로 조용히 넘어갑니다. 이로 인해 잘못된 모델이 쿼리에 응답하게 됩니다.
해결책
해결 방법은 OpenClaw와 Ollama 사이에 위치하는 작은 프록시를 구현하는 것입니다. 이 프록시는 두 가지 주요 기능을 수행합니다:
- 두 시스템 간의 API 형식을 변환합니다
- 적절한 위치에
think: false를 주입합니다
올바르게 구성되면 Qwen3.x 모델은 실행, 파일 읽기, 웹 검색, Sheets 통합, Slack 통합 및 메모리 작업을 포함한 완전한 도구 호출 평가에서 완벽한 점수(15/15)를 통과합니다.
구현 세부사항
원본은 다음을 포함한 포괄적인 설명을 제공합니다:
- 프록시 설정 지침
- 모두 올바르게 설정해야 하는 여섯 가지 특정 구성 설정
- 모니터링 접근 방식
- 작동하지 않는 것(피해야 할 일반적인 함정)
코드 조각 및 구성 예제를 포함한 전체 기술 세부사항은 링크된 gist에서 확인할 수 있습니다.
📖 전체 원문 읽기: r/LocalLLaMA
👀 See Also

GitHub 저장소 소유자: AI 봇 스팸을 차단하기 위해 Git의 --author 플래그 사용
Archestra는 GitHub의 'prior contributors' 설정과 Git의 --author 플래그를 활용하여 캡차 기반 온보딩 절차를 통해 실제 인간을 화이트리스트에 등록함으로써 AI 댓글/PR 스팸과 싸웠습니다.

클로드 대 GPT 박사 학위 논문 작성: 방법론 섹션에서 기술적 의미 보존
박사 과정 학생이 컴퓨터 비전/하드웨어 공동 설계 논문을 다듬는 데 Claude와 GPT를 비교한 결과, Claude가 기술적 의미와 논증 구조를 더 안정적으로 보존하는 반면 GPT는 때때로 주장을 지나치게 단순화한다는 내용을 공유합니다.

클로드로 API 엔드포인트 구축하기: 70개 이상의 엔드포인트 프로젝트에서 얻은 실용적인 프롬프트 엔지니어링 교훈
한 개발자가 Claude를 사용하여 코드의 약 80%를 작성하며 70개 이상의 LinkedIn 자동화 API 엔드포인트를 구축했습니다. 이 프로젝트는 행동 수행 에이전트(API 호출, 데이터 추출, 의사결정 트리 등을 실행하는 에이전트)를 위한 프롬프트 구성에 대한 구체적인 교훈을 보여주었는데, 자연어 지시보다는 명시적 제약 조건을 가진 계약서처럼 프롬프트를 다루는 것이 더 효과적임을 발견했습니다.

OpenClaw 응답 시간 개선 방법: 컨텍스트 비대화 줄이기
개발자가 OpenClaw에서 파일 구조 조정과 설정 변경을 통해 주입된 작업 공간 파일을 47,000자에서 16,000자로 줄이고, bootstrapMaxChars를 8000으로 설정하고 압축 안전장치를 추가하여 10분 응답 시간 문제를 해결했습니다.