Meera: Qwen3.5-2B 기반의 완전 오프라인 리눅스 그놈 AI 어시스턴트

Meera는 Linux Gnome Desktop용 로컬 AI 어시스턴트로, 완전히 오프라인에서 실행됩니다. 소프트웨어 개발이 처음인 하드웨어 엔지니어가 Cursor(AI 지원 코딩)를 사용하여 제작했으며, 보급형 하드웨어에서도 작동하도록 설계되었습니다. 설치 프로그램이 llama-cpp를 설정하고 모델을 다운로드합니다 — 클라우드 의존성 없음.
주요 아키텍처 세부 사항
- 기본 모델: Qwen3.5-2B-Q4_K_M (1.2GB, 약 2B 매개변수)
- 추론 엔진: Vulkan 백엔드가 있는 llama-cpp (GPU 자동 감지: Nvidia/AMD/Intel/iGPU)
- 도구 선택: 두 번째 작은 임베딩 모델이 프롬프트에 모든 도구 스키마를 포함하는 대신 가장 가까운 도구 일치 항목과 RAG 청크를 선별합니다 — 소형 모델의 안정성에 중요
- 테스트된 하드웨어: Ubuntu 24.04 + RTX 5090(데스크탑), Fedora Silverblue + Intel i3(노트북) — 둘 다 충분히 빠름
Meera가 할 수 있는 일
도구 호출 예시 (출처):
- 내일 오전 10시 팀 회의를 캘린더에 추가
- 30분 후에 누군가에게 이메일 보내라고 알림
- 볼륨, 밝기, Wi-Fi 제어
- 다크/라이트 모드 전환, 나이트 라이트 켜기/끄기
- 문서에서 "project_description" 파일 검색 및 열기
- CPU를 너무 많이 사용하는 프로세스 확인
- 패키지 업데이트 확인
Linux 초보자:
- 특정 작업에 맞는 소프트웨어 추천
- grep/sed/awk 사용법 설명
- zip/tar 파일 압축/해제 명령어 제공
저장소 구조 및 사용자 정의
GitHub 저장소(현재 Linux에서만 유용)는 위키에 문서화된 아키텍처를 제공합니다. 비Linux 사용자는 코드를 재사용할 수 있습니다 — tools와 rag_data 디렉토리만 수정하면 됩니다. 모델은 더 큰 것으로 교체 가능합니다.
GitHub: achinivar/meera
저자는 다음에 음성-텍스트와 텍스트-음성을 추가할 계획입니다. 버그 및 도구 아이디어는 GitHub 이슈나 댓글로 환영합니다.
📖 전체 출처 읽기: r/LocalLLaMA
👀 See Also

주간 자동 업데이트가 가능한 프린터블 클로드 코드 치트 시트
한 개발자가 클로드 코드를 위한 주간 자동 업데이트가 되는 프린트 가능 치트 시트를 만들었습니다. 이 시트는 클로드 자체를 사용하여 문서와 GitHub의 기능을 연구한 후 생성되었습니다.

Tripsy, Claude용 MCP 서버 출시: 구조화된 API로 여행 관리
Tripsy의 공식 MCP 서버를 통해 Claude가 여행, 활동, 숙소, 교통, 비용 데이터를 직접 읽고 생성 및 업데이트할 수 있습니다. 설정은 Claude의 커스텀 커넥터를 통해 약 1분이면 완료됩니다.

ZSE: 3.9초의 콜드 스타트를 지원하는 오픈소스 LLM 추론 엔진
ZSE는 오픈소스 LLM 추론 엔진으로, 32B 모델의 메모리 요구량을 64GB에서 19.3GB VRAM으로 줄이고, 사전 양자화된 .zse 포맷과 메모리 매핑된 가중치를 사용해 7B 모델의 콜드 스타트를 3.9초로 단축합니다.

Axe: 단일 목적 LLM 에이전트를 위한 12MB CLI
Axe는 TOML 파일로 정의된 집중된 AI 에이전트를 실행하는 경량 Go 바이너리입니다. Unix 프로그램처럼 에이전트를 다루며, stdin 파이핑, 하위 에이전트 위임, 다중 제공자 LLM 통합을 지원합니다.