수정된 vLLM 0.17.0이 Tesla P40에서 Qwen3 ASR 1.7B로 실시간 음성 인식을 실행합니다.

✍️ OpenClawRadar📅 게시일: March 9, 2026🔗 Source
수정된 vLLM 0.17.0이 Tesla P40에서 Qwen3 ASR 1.7B로 실시간 음성 인식을 실행합니다.
Ad

개발자가 vLLM 0.17.0을 성공적으로 수정하여 Tesla P40 GPU에서 실행할 수 있게 했으며, Qwen3 ASR 1.7B 모델을 활용한 실시간 강의 녹취가 가능해졌습니다. P40은 일반적으로 최신 추론 엔진을 지원하지 않는 Pascal 아키텍처를 사용합니다.

주요 세부사항

이 개발자는 실시간 강의 녹취를 위한 개인 프로젝트를 진행 중이었습니다. 처음에는 Qwen3 ASR 1.7B 모델을 사용할 계획이었지만, 진정한 실시간 녹취는 vLLM을 통해서만 지원된다는 사실을 발견했습니다. 오디오 샘플을 청크로 나누는 대안 대신, 실험적인 수정을 시도했습니다.

Codex를 사용하여 vLLM을 Pascal 아키텍처에서 실행되도록 수정했습니다. 이를 통해 Tesla P40 서버 GPU에서 Qwen3 ASR 1.7B 모델을 실행할 수 있게 되었습니다. 결과는 거의 완벽한 하드웨어 가속과 완전한 실시간 녹취였습니다.

수정된 vLLM 포크는 다음에서 이용 가능합니다: https://github.com/uaysk/vllm-pascal

다음 단계와 과제

개발자의 다음 목표는 이 설정에서 Qwen3.5 모델을 실행해 보는 것입니다. 그러나 여러 기술적 문제가 있습니다. 비전 기능은 사용할 수 없는 것으로 보이며, 텍스트 기능만 사용하는 것도 어려움이 있습니다. 현재로서는 가능할지 여부를 확신하지 못하고 있습니다.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

단일 AI 에이전트에서 여러 텔레그램 봇을 실행하여 병렬 작업 수행하기
Use Cases

단일 AI 에이전트에서 여러 텔레그램 봇을 실행하여 병렬 작업 수행하기

한 개발자가 AI 에이전트가 한 작업을 마치길 기다리지 않고 다른 작업을 시작할 수 있도록, 세 개의 텔레그램 봇을 동일한 기본 에이전트에 연결하는 방법으로 문제를 해결했습니다. 각 봇은 자체 채팅과 대화 기록을 갖고 독립적으로 작동하면서도 동일한 작업 공간, 메모리, 학습 내용을 공유합니다.

OpenClawRadar
OpenClaw로 7-에이전트 AI 트레이딩 데스크 구축하기
Use Cases

OpenClaw로 7-에이전트 AI 트레이딩 데스크 구축하기

OpenClaw를 사용하여 7개의 에이전트로 구성된 AI 트레이딩 데스크 구축 사례를 소개합니다. Mac mini에서 Claude를 두뇌로 구동되며, 커스텀 Flask 대시보드와 Cron 작업을 특징으로 합니다.

OpenClawRadar
OpenClaw와 Notion으로 신뢰할 수 있는 현금흐름 에이전트 구축하기: SMS 파싱 및 거래 라벨링에 관한 교훈
Use Cases

OpenClaw와 Notion으로 신뢰할 수 있는 현금흐름 에이전트 구축하기: SMS 파싱 및 거래 라벨링에 관한 교훈

한 개발자가 SMS 알림, 아이폰 단축어, 노션, OpenClaw를 활용해 비즈니스 원장 추적을 자동화하는 로컬 퍼스트 AI 에이전트를 구축했습니다. 이 시스템은 작동하지만, 은행 SMS 줄바꿈 처리, 맥락적 파싱을 위한 AI 활용, 소액 거래 추적을 위한 프롬프트 튜닝이라는 세 가지 신뢰성 문제를 해결해야 했습니다.

OpenClawRadar
RunLobster AI 에이전트는 자연어 요청으로부터 기능적인 대시보드를 구축합니다.
Use Cases

RunLobster AI 에이전트는 자연어 요청으로부터 기능적인 대시보드를 구축합니다.

한 개발자가 보고하기를, RunLobster가 단일 자연어 명령에 대한 응답으로 Stripe 통합 및 인증 기능을 갖춘 완전한 대시보드를 구축하고 배포했으며, 일반적으로 며칠이 걸릴 작업을 몇 분 만에 완료했다고 합니다.

OpenClawRadar