클로드 소넷 4.6, 네 개의 Qwen3.5 로컬 모델에서 버그 보고서 등급 평가

✍️ OpenClawRadar📅 게시일: March 15, 2026🔗 Source
클로드 소넷 4.6, 네 개의 Qwen3.5 로컬 모델에서 버그 보고서 등급 평가
Ad

버그 리포트 생성을 위한 로컬 모델 테스트

Sonnet/Haiku에서 32GB M5 MacBook Air의 로컬 모델로 전환한 개발자가 버그 리포트 작성 능력을 평가하기 위해 4가지 Qwen3.5 변형 모델을 테스트했습니다. LM Studio를 서버로, opencode CLI를 모델 호출에 사용하여 각 모델에게 장비를 해제한 후 테두리 색상이 제대로 재설정되지 않는 iOS 게임 문제를 연구하고 버그 리포트를 작성하도록 요청했습니다.

테스트된 모델

  • Tesslate/OmniCoder-9B-GGUF Q8_0
  • lmstudio-community/Qwen3.5-27B-GGUF Q4_K_M
  • Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF Q4_K_M
  • lmstudio-community/Qwen3.5-35B-A3B-GGUF Q4_K_M

버그 확인

핵심 버그는 소스 파일에서 확인되었습니다. EquipmentSlotNode.swift에서 setEquipment 메서드의 if let c = borderColor 가드는 nil이 전달될 때 할당을 조용히 건너뜁니다. EquipmentNode.swift에서 updateEquipment(from:)은 빈 슬롯에 대해 borderColor: nil을 전달하므로 테두리 색상이 절대 재설정되지 않습니다. setEquipment에 대한 문서는 "현재 색상을 유지하려면 nil을 전달하세요"라고 설명하며, 고장난 동작을 의도적인 설계로 문서화하고 있습니다.

Ad

Claude Sonnet 4.6의 리포트 평가

bug_report_9b_omnicoder — A−

네 가지 중 최고입니다. 가장 깔끔하고 관용적인 Swift 수정안을 제안합니다: borderShape.strokeColor = borderColor ?? theme.textDisabledColor.skColor — 불필요한 분기 없이 if let 블록을 단일 라인으로 대체합니다. 트리거 흐름의 일부인 추가 컨텍스트 파일(GameScene.swift, BackpackManager.swift)을 언급한 유일한 리포트입니다.

부족한 점: 다른 네 리포트와 마찬가지로 테스트 코드가 컴파일되지 않습니다. borderShape은 EquipmentSlotNode에서 private let으로 선언되어 있으며 — @testable import는 internal만 노출하고 private은 노출하지 않습니다. 문서 주석 업데이트 필요성을 언급하지 않습니다.

bug_report_27b_lmstudiocommunity — B+

정확한 진단입니다. 깔끔한 두 분기 수정안을 제안합니다: if id != nil { borderShape.strokeColor = borderColor ?? theme.textDisabledColor.skColor } else { borderShape.strokeColor = theme.textDisabledColor.skColor } — 필요 이상으로 장황하지만 정확합니다. EquipmentNode.updateEquipment을 호출자로 정확히 식별하고 통합 테스트 제안을 포함합니다.

부족한 점: LogicTests/EquipmentNodeTests.swift에서 테스트를 제안합니다 — 이 파일은 이미 존재하며 EquipmentNode를 다루지 EquipmentSlotNode를 다루지 않습니다. 테스트 코드에서 동일한 private 접근 문제가 있습니다.

bug_report_27b_jackrong — B−

정확한 진단이지만 가장 약한 수정안을 제안합니다. else 블록 내부에 재설정을 추가합니다: borderShape.strokeColor = theme.textDisabledColor.skColor // 테두리 초기화 — 특정 해제 사례에 대해 기술적으로 정확하지만 전체 메서드를 혼란스러운 상태로 남깁니다. else 블록의 테두리 재설정은 누군가가 id: nil, borderColor: someColor를 전달하면 아래의 if let 블록에 의해 즉시 재정의될 수 있습니다. 이 수정안은 중복성을 정리하지 않고 특정 실패만 패치합니다.

개발자는 RAM에 최대한 맞추기 위해 컨텍스트 창 크기를 제외한 기본 매개변수를 사용했으며, 일부 조정이 개선을 제공할 수 있다고 언급했습니다. 일부 unsloth 모델을 시도했지만 제한된 성공만 거두었습니다.

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

MCP 서버를 사용하여 Claude를 실시간 데이터베이스에 연결해 주문형 분석 수행하기
Use Cases

MCP 서버를 사용하여 Claude를 실시간 데이터베이스에 연결해 주문형 분석 수행하기

한 개발자가 사이버보안 도구를 위한 MCP 서버를 구축하여 Claude를 10,000개 이상의 사이버보안 제품 데이터베이스에 연결했으며, 기존 대시보드 대신 실시간 데이터 분석을 가능하게 했습니다. 이 서버는 공급업체 비교, 시장 카테고리 분석, NIST CSF 2.0 적용 범위 확인을 위한 40가지 도구를 제공합니다.

OpenClawRadar
기업 개발자의 백엔드 개발을 위한 Claude 워크플로우
Use Cases

기업 개발자의 백엔드 개발을 위한 Claude 워크플로우

미국 대형 금융 회사의 백엔드 개발자가 클로드 AI와의 개발 작업을 위한 일반적인 워크플로우를 공유했습니다. 이 과정은 클로드와의 구조화된 상호작용과 특수화된 리뷰 도구를 포함합니다.

OpenClawRadar
물류 회사를 위한 OpenClaw 구현: 이메일 구문 분석 및 상태 업데이트
Use Cases

물류 회사를 위한 OpenClaw 구현: 이메일 구문 분석 및 상태 업데이트

한 개발자가 소규모 물류 회사를 위해 OpenClaw를 구성하여 이메일 파싱, 스프레드시트 상호 참조 및 상태 업데이트를 자동화했으며, 최소한의 코드로 사장님의 하루 2-3시간을 절약했습니다.

OpenClawRadar
OpenClaw와 Chorus: 두 명의 인간과 AI 에이전트가 일주일 만에 구축한 제품 파이프라인
Use Cases

OpenClaw와 Chorus: 두 명의 인간과 AI 에이전트가 일주일 만에 구축한 제품 파이프라인

OpenClaw와 Chorus가 협력하여 AI 에이전트가 연구, 제품 관리, 코딩 작업을 처리하고 인간은 아이디어 제안과 작업 승인에 집중하는 제품 개발 파이프라인을 구축합니다. 이 시스템은 주간 직장을 가진 두 사람이 일주일도 채 되지 않아 구축했습니다.

OpenClawRadar