Qwen3.5-27B-FP8 성능 벤치마크 (OpenClaw 에이전트 포함)

✍️ OpenClawRadar📅 게시일: February 28, 2026🔗 Source

Qwen3.5-27B-FP8 성능 벤치마크 (OpenClaw 에이전트 포함)

Ad

커뮤니티 테스트 성능 벤치마크

커뮤니티 테스트는 48GB VRAM을 탑재한 단일 수정 RTX 4090 GPU를 사용하여 수행되었습니다. 공식 Qwen3.5-35B-A3B-FP8 및 Qwen3.5-27B-FP8 모델이 256K 컨텍스트 길이로 테스트되었습니다.

프레임워크 권장사항

SGLang을 권장합니다 접두사 캐싱을 완전히 지원하는 유일한 프레임워크로, Qwen3.5의 하이브리드 어텐션 아키텍처에 필수적입니다.

100K 컨텍스트 기준: 콜드 스타트 프리필은 약 10초 소요
캐싱 적용 시: 프리필이 200ms로 감소
결과: 매우 낮은 첫 토큰 지연 시간과 극도로 빠른 출력

모델 성능 지표

Qwen3.5-35B-A3B-FP8: 120 토큰/초로 시작하여 80 토큰/초로 감소
Qwen3.5-27B-FP8: 20 토큰/초로 시작하여 약간 감소한 18 토큰/초

OpenClaw 에이전트 확장성

OpenClaw는 6개의 에이전트를 동시에 실행하는 에이전트 팀을 운영할 수 있으며, 속도가 120 토큰/초까지 확장됩니다. 테스터는 이 확장 동작에 놀라움을 표시했습니다.

언급된 단점은 이 구성에서 단일 스레드 성능이 느리다는 점입니다.

MTP 최적화 참고사항

27B-FP8 모델에 MTP(다중 토큰 예측)를 활성화하면 단일 요청 생성 속도를 크게 향상시킬 수 있습니다:

단일 NVIDIA H100 기준: 20K 컨텍스트 창으로 100 토큰/초 유지
64K 토큰 프리필 속도: 1초 미만

중요 주의사항: MTP는 접두사 캐싱과 충돌하며 VRAM 사용량이 매우 높습니다. RTX 4090 사용자는 낮은 num-steps 설정으로 시작해야 합니다.

📖 전체 출처 읽기: r/openclaw

Ad

👀 See Also

벤치마크 결과: Apple Silicon 대 AMD GPU에서 ROCm 및 Vulkan을 사용한 Qwen3.5 모델 성능 비교

벤치마크 결과: Apple Silicon 대 AMD GPU에서 ROCm 및 Vulkan을 사용한 Qwen3.5 모델 성능 비교

한 개발자가 Apple Silicon Mac과 AMD GPU 워크스테이션에서 Qwen3.5 모델(35B MoE, 27B dense, 122B MoE)을 벤치마킹하여 ROCm과 Vulkan 백엔드를 컨텍스트 스케일링 테스트와 비교했습니다. 하드웨어에는 M5 Max, M1 Max 및 다양한 PCIe 구성의 세 가지 AMD GPU가 포함되었습니다.

Mar 26, 2026, 06:45 PM UTC

미국 법 집행 기관, AI 반발 속 '안티테크 극단주의'를 새로운 위협 범주로 지정

미국 법 집행 기관, AI 반발 속 '안티테크 극단주의'를 새로운 위협 범주로 지정

국토안보부, FBI 및 퓨전 센터가 '반기술 폭력 극단주의'라는 새로운 범주를 감시하고 있습니다. 이는 트럼프 행정부 지시에 따라 인공지능 관련 시위, 데이터 센터 위협 및 반대 의견을 표적으로 삼습니다.

Jun 15, 2026, 12:16 AM UTC

마크 저커버그, CEO 지원용 AI 에이전트 개발 중

마크 저커버그, CEO 지원용 AI 에이전트 개발 중

월스트리트저널 보고서에 따르면, 마크 저커버그가 CEO 업무를 돕기 위한 AI 에이전트를 구축 중이라고 합니다. 이 기사는 해커뉴스에 공유되어 37점을 받고 30개의 댓글이 달렸습니다.

Mar 23, 2026, 11:45 PM UTC

러버블은 국제 여성의 날을 기념하여 24시간 무료 이용과 파트너 크레딧 350달러를 제공합니다.

러버블은 국제 여성의 날을 기념하여 24시간 무료 이용과 파트너 크레딧 350달러를 제공합니다.

Lovable은 24시간 무료 빌딩 접근권과 함께 Anthropic의 Claude API 토큰 $100, Stripe 처리 수수료 크레딧 $250을 제공합니다. 이 혜택은 3월 9일 오전 12시 59분에 종료됩니다.

Apr 17, 2026, 08:45 PM UTC