벤치마크 결과: Apple Silicon 대 AMD GPU에서 ROCm 및 Vulkan을 사용한 Qwen3.5 모델 성능 비교

✍️ OpenClawRadar📅 게시일: March 26, 2026🔗 Source
벤치마크 결과: Apple Silicon 대 AMD GPU에서 ROCm 및 Vulkan을 사용한 Qwen3.5 모델 성능 비교
Ad

하드웨어 및 소프트웨어 설정

벤치마크는 세 가지 시스템을 비교했습니다: Apple M5 Max(48GB 통합 메모리)가 탑재된 MacBook Pro, Apple M1 Max(64GB 통합 메모리)가 탑재된 Mac Studio, 그리고 Intel Core Ultra 7 265K 프로세서와 세 가지 AMD GPU(Radeon Pro W7900(48GB, RDNA 3), Radeon AI PRO R9700(32GB, RDNA 4), Radeon Pro W6800(32GB, RDNA 2))가 장착된 Fedora 43 GPU 서버입니다. 메인보드는 x8/x8/x4 전기적 연결을 제공했으며, W6800은 DMI 링크로 인해 병목 현상이 발생하는 칩셋 연결 x4 슬롯에 장착되었습니다.

추론 엔진 및 모델

Apple 시스템은 mlx-lm(버전 0.31.1 및 0.31.0)을 사용했습니다. Fedora 서버는 llama.cpp를 HIP/ROCm 빌드(b5065)와 AMDVLK Vulkan 빌드(b5065) 모두로 실행했습니다. ROCm 버전은 7.2, AMDVLK 버전은 2025.Q2.1이었습니다. 모든 Fedora 실행은 단일 GPU를 사용했으며, 122B 모델은 W7900 + R9700을 --split-mode layer로 사용한 경우를 제외했습니다.

테스트된 모델은 Qwen3.5-35B-A3B MoE(3B 활성 매개변수, mlx-community 4비트 또는 unsloth Q4_K_M), Qwen3.5-27B dense(27B 매개변수, mlx-community 4비트 또는 unsloth Q4_K_M), 그리고 Qwen3.5-122B-A10B MoE(10B 활성 매개변수, unsloth Q3_K_XL)였습니다.

Ad

벤치마크 방법론

벤치마크는 약물감시 데이터 분석 사용 사례를 반영했습니다: 추출 스크립트 작성, 임상 데이터에 대한 추론, 규제 서사 생성, 임상 텍스트에서의 구조화된 데이터 추출. 프롬프트는 도메인 특화적이었으며, 일반적인 LLM 벤치마크가 아니었습니다.

표준 벤치마크는 8K 컨텍스트와 7개의 프롬프트를 사용했습니다: 2개의 프롬프트 처리 테스트(짧은 ~27 토큰 및 긴 ~2.9K 토큰 입력, 최소 출력으로 프리필 속도 분리)와 5개의 생성 작업(짧은 코딩, 중간 코딩, 수학 추론, 규제 안전 서사 작성, 구조화된 이상반응 추출). 단일 사용자, 단일 요청, 온도 0.3, /no_think으로 사고 모드 비활성화, 요청 간 프롬프트 캐싱 없음.

컨텍스트 스케일링 벤치마크는 동일한 모델과 GPU를 사용하여 점진적으로 더 큰 프롬프트(512에서 16K+ 토큰)를 사용했으며, 합성 이상반응 목록으로 구성되었고, 64 최대 출력 토큰만으로 입력 크기에 따른 프롬프트 처리 및 생성의 확장 방식을 분리했습니다.

주요 발견 사항

벤치마크는 ROCm 대 AMDVLK Vulkan에 대한 흥미로운 결과를 보여주었으며, 각 백엔드가 언제 최고 성능을 발휘하는지 보여주는 컨텍스트 스케일링 테스트를 포함했습니다. 소스는 대부분의 기존 비교가 M5 Max 노트북과 W7900 워크스테이션 같은 구성 간 선택이나 Vulkan 대비 ROCm 설정의 번거로움 가치를 판단하는 데 도움이 되지 않는다고 언급합니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

실리콘밸리 개발자들, 클로드 AI 집중 사용 패턴과 인프라 부담 보고
News

실리콘밸리 개발자들, 클로드 AI 집중 사용 패턴과 인프라 부담 보고

메타의 한 시니어 AI 엔지니어가 Claude Code 토큰에 월 2,000달러를 지출하고, 2개 이상의 에이전트를 동시에 실행하며, Claude 대화에서 Obsidian 지식 그래프를 자동 생성하는 VS Code 확장 프로그램을 구축했습니다. 리뷰 없이 Claude가 생성한 코드를 배포한 결과 인프라가 '완전히 망가졌다'고 보고됩니다.

OpenClawRadar
Claude Code v2.1.98은 Vertex AI 마법사, 보안 수정 사항 및 서브프로세스 샌드박싱을 추가합니다.
News

Claude Code v2.1.98은 Vertex AI 마법사, 보안 수정 사항 및 서브프로세스 샌드박싱을 추가합니다.

Claude Code v2.1.98은 대화형 Google Vertex AI 설정 마법사를 도입하고, Linux에서 PID 네임스페이스 격리를 통한 서브프로세스 샌드박싱을 추가하며, Bash 권한 우회 및 임의 코드 실행 위험을 포함한 여러 보안 취약점을 수정합니다.

OpenClawRadar
Infomaniak, 다수의 의결권을 재단에 이전하여 스위스 클라우드의 독립성 확보
News

Infomaniak, 다수의 의결권을 재단에 이전하여 스위스 클라우드의 독립성 확보

Infomaniak이 스위스 공익 재단에 의결권 과반을 이전하여 장기적 독립성을 확보했습니다. 재단 승인 없이는 인수가 불가능합니다.

OpenClawRadar
AGI로 가는 첫걸음: ClawDBot으로 격차 해소하기
News

AGI로 가는 첫걸음: ClawDBot으로 격차 해소하기

ClawDBot이 AI 코딩 에이전트를 향상시킴으로써 AGI를 향해 나아가는 방법을 탐구하며, AI 진화의 중요한 단계를 보여줍니다.

OpenClawRadar