Construire un Mentor de Carrière IA avec 5 Agents Ollama

Un développeur a construit un système d'IA multi-agents appelé "AI Career Mentor" qui lit les CV et produit des rapports complets d'intelligence de carrière. Le système fonctionne entièrement en local en utilisant Ollama avec llama3, sans nécessiter de clés API ni de coûts externes.

Architecture technique

Le système se compose de cinq agents spécialisés qui enchaînent leurs sorties :

Chaque agent reçoit la sortie de l'agent précédent comme contexte partagé
L'agent de feuille de route connaît vos lacunes en compétences grâce à l'agent d'analyse
L'agent de salaire connaît votre feuille de route grâce à l'agent précédent
Cet enchaînement rend le rapport progressivement plus intelligent au fur et à mesure qu'il traverse le pipeline

Détails de la pile technologique

Moteur d'IA : Ollama + llama3 (100% local)
Système RAG : FAISS + SentenceTransformers pour indexer votre base de connaissances
Couche d'outils : MCP (Model Context Protocol) - FastAPI lance le serveur MCP en tant que sous-processus et communique via JSON-RPC stdio
Traitement des CV : pdfplumber pour lire les CV en PDF
Interface : React

Notes d'implémentation MCP

Le développeur a trouvé MCP particulièrement intéressant à construire. MCP est le standard ouvert d'Anthropic pour connecter l'IA aux outils, utilisant un serveur qui peut fonctionner avec n'importe quel client. Le système se connecte également à Claude Desktop via un fichier de configuration, permettant à Claude d'appeler directement les 9 outils.

Un bug notable rencontré : le SDK MCP v1.x a complètement changé les signatures des gestionnaires. L'ancien code passe un objet de requête complet, tandis que le nouveau code décompresse directement le nom et les arguments. Cela a causé un temps de débogage important.

Sorties du rapport

Le système génère un rapport complet d'intelligence de carrière incluant :

Analyse du CV
Identification des lacunes en compétences
Feuille de route sur 6 mois
Stratégie salariale
Préparation aux entretiens

Tous les composants s'exécutent en une seule fois après le traitement du CV.

Ressources

Le projet est disponible sur GitHub avec une visite guidée en vidéo. Le développeur note que la configuration RAG et le câblage client/serveur MCP étaient les parties les plus délicates à mettre en œuvre.

📖 Read the full source: r/LocalLLaMA