Mentor de Carrière Multi-Agents Construit avec Ollama et MCP pour l'IA Locale

Un développeur a construit un système d'IA multi-agents appelé "AI Career Mentor" qui lit les CV et produit des rapports complets d'intelligence de carrière. Le système fonctionne entièrement en local en utilisant Ollama avec llama3, sans nécessiter de clés API ni de coûts externes.
Architecture technique
Le système se compose de cinq agents spécialisés qui enchaînent leurs sorties :
- Chaque agent reçoit la sortie de l'agent précédent comme contexte partagé
- L'agent de feuille de route connaît vos lacunes en compétences grâce à l'agent d'analyse
- L'agent de salaire connaît votre feuille de route grâce à l'agent précédent
- Cet enchaînement rend le rapport progressivement plus intelligent au fur et à mesure qu'il traverse le pipeline
Détails de la pile technologique
- Moteur d'IA : Ollama + llama3 (100% local)
- Système RAG : FAISS + SentenceTransformers pour indexer votre base de connaissances
- Couche d'outils : MCP (Model Context Protocol) - FastAPI lance le serveur MCP en tant que sous-processus et communique via JSON-RPC stdio
- Traitement des CV : pdfplumber pour lire les CV en PDF
- Interface : React
Notes d'implémentation MCP
Le développeur a trouvé MCP particulièrement intéressant à construire. MCP est le standard ouvert d'Anthropic pour connecter l'IA aux outils, utilisant un serveur qui peut fonctionner avec n'importe quel client. Le système se connecte également à Claude Desktop via un fichier de configuration, permettant à Claude d'appeler directement les 9 outils.
Un bug notable rencontré : le SDK MCP v1.x a complètement changé les signatures des gestionnaires. L'ancien code passe un objet de requête complet, tandis que le nouveau code décompresse directement le nom et les arguments. Cela a causé un temps de débogage important.
Sorties du rapport
Le système génère un rapport complet d'intelligence de carrière incluant :
- Analyse du CV
- Identification des lacunes en compétences
- Feuille de route sur 6 mois
- Stratégie salariale
- Préparation aux entretiens
Tous les composants s'exécutent en une seule fois après le traitement du CV.
Ressources
Le projet est disponible sur GitHub avec une visite guidée en vidéo. Le développeur note que la configuration RAG et le câblage client/serveur MCP étaient les parties les plus délicates à mettre en œuvre.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Système de mémoire MCP local avec consolidation pour les conversations d'IA
Un développeur a créé un serveur MCP qui fournit une mémoire locale persistante pour les clients d'IA, utilisant Qwen 2.5-7B pour consolider les conversations en documents de connaissances structurés toutes les 6 heures. Le système fonctionne entièrement sur votre matériel avec une déduplication sémantique, un score adaptatif et une recherche vectorielle FAISS.

Anthropic open-source Claude pour le droit : suite de plugins pour la révision de contrats, le tri des NDA et plus encore
Anthropic a publié Claude for Legal, un dépôt de plugins, d'agents et de connecteurs MCP pour les workflows juridiques, notamment la révision de contrats fournisseurs, le tri des NDA et la surveillance réglementaire.

L'application iOS ClawTalk permet le chat vocal avec des agents IA OpenClaw auto-hébergés.
ClawTalk est une application iOS native qui offre une discussion vocale par appui pour parler pour les configurations OpenClaw auto-hébergées de LLM. Elle comprend la reconnaissance vocale sur l'appareil via WhisperKit, des réponses en streaming en temps réel avec rendu markdown, et prend en charge plusieurs options de synthèse vocale, notamment ElevenLabs, OpenAI et les voix intégrées d'Apple.

Claude Session Tracker : Sauvegarde automatique des sessions de code Claude vers les problèmes GitHub
Un nouvel outil appelé claude-session-tracker enregistre automatiquement les sessions Claude Code dans des Issues GitHub, en journalisant chaque prompt et réponse sous forme de commentaires avec des horodatages. Il crée une Issue GitHub par session liée à un tableau Projects et fonctionne via le système de hooks natif de Claude Code sans consommer de tokens de contexte.