Meera : Un assistant IA entièrement hors ligne pour Linux Gnome basé sur Qwen3.5-2B

Meera est un assistant IA local pour le bureau Linux Gnome qui fonctionne entièrement hors ligne. Construit par un ingénieur matériel novice en développement logiciel, il utilise Cursor (codage assisté par IA) et est conçu pour fonctionner sur du matériel modeste. L'installateur configure llama-cpp et télécharge le modèle — aucune dépendance au cloud.
Détails clés de l'architecture
- Modèle principal : Qwen3.5-2B-Q4_K_M (1,2 Go, ~2B paramètres)
- Moteur d'inférence : llama-cpp avec backend Vulkan (détection automatique du GPU : Nvidia/AMD/Intel/iGPU)
- Sélection d'outils : Un deuxième modèle d'embedding minuscule sélectionne les outils les plus proches et les fragments RAG au lieu d'intégrer tous les schémas d'outils dans le prompt — essentiel pour la fiabilité avec les petits modèles
- Matériel testé : Ubuntu 24.04 + RTX 5090 (bureau), Fedora Silverblue + Intel i3 (portable) — suffisamment rapide sur les deux
Ce que Meera peut faire
Exemples d'appels d'outils (issus de la source) :
- Ajouter une réunion d'équipe demain à 10h au calendrier
- Me rappeler d'envoyer un e-mail à quelqu'un dans 30 minutes
- Contrôle du volume, de la luminosité, du Wi-Fi
- Passer en mode sombre/clair, activer/désactiver la veilleuse
- Chercher et ouvrir le fichier "project_description" dans Documents
- Vérifier quels processus utilisent trop de CPU
- Vérifier les mises à jour de paquets
Pour les nouveaux utilisateurs Linux :
- Recommander un logiciel pour une tâche donnée
- Expliquer l'utilisation de grep/sed/awk
- Fournir des commandes pour compresser/décompresser des fichiers zip/tar
Structure du dépôt et personnalisation
Le dépôt GitHub (actuellement utile seulement sur Linux) fournit une architecture documentée dans le wiki. Les utilisateurs non-Linux peuvent réutiliser le code — seuls les répertoires tools et rag_data nécessitent des modifications. Le modèle peut être remplacé par un plus grand.
GitHub : achinivar/meera
L'auteur prévoit d'ajouter la conversion voix-texte et texte-parole prochainement. Les bugs et idées d'outils sont les bienvenus via les issues GitHub ou les commentaires.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Résultats de Référence pour les Modèles Locaux de Petite Taille et les Modèles OpenRouter sur la Tâche Agentique de Text-to-SQL
Un développeur a testé plusieurs petits modèles locaux et OpenRouter en utilisant un benchmark agentique personnalisé de conversion de texte en SQL qui transforme des requêtes en anglais en SQL avec des cycles de débogage. Le benchmark comprend 25 questions, s'exécute en moins de 5 minutes, et révèle les meilleurs modèles comme kimi-k2.5 et les variantes de Qwen 3.5.
Le mode Brainstorming de ClaudeAI s’accompagne d’un visuel pour les maquettes et l’approbation UI
Un utilisateur découvre une nouvelle fonctionnalité « Compagnon visuel » dans le mode brainstorming de ClaudeAI qui sert des maquettes sur un serveur web local, permettant des allers-retours de modifications UI avant de construire.

Compétence de Traduction Vidéo OpenClaw Disponible sur ClawHub
Une nouvelle compétence de traduction vidéo pour les agents OpenClaw permet aux utilisateurs de télécharger une vidéo ou de fournir une URL pour obtenir un aperçu traduit instantanément. La compétence est hébergée sur ClawHub.

Steelman R5 : Le modèle 14B affiné surpasse Claude Opus pour la génération de code Ada
Un développeur a affiné Qwen2.5-Coder-14B-Instruct en utilisant QLoRA sur un ensemble de données vérifié par un compilateur contenant 3 430 paires d'instructions Ada/SPARK, obtenant un taux de compilation de 68,6 % sur un benchmark personnalisé contre 42,1 % pour Claude Opus 4.6. Le modèle est disponible via Ollama et tient dans 12 Go de VRAM.