Sistema Multi-Agente con Ollama y MCP para Carreras

Un desarrollador ha construido un sistema de IA multiagente llamado "AI Career Mentor" que lee currículums y produce informes completos de inteligencia profesional. El sistema funciona completamente de forma local usando Ollama con llama3, sin necesidad de claves API ni costos externos.

Arquitectura Técnica

El sistema consta de cinco agentes especializados que encadenan sus salidas:

Cada agente recibe la salida del agente anterior como contexto compartido
El agente de hoja de ruta conoce tus brechas de habilidades del agente de análisis
El agente de salario conoce tu hoja de ruta del agente anterior
Este encadenamiento hace que el informe sea progresivamente más inteligente a medida que avanza por la tubería

Detalles del Stack Tecnológico

Motor de IA: Ollama + llama3 (100% local)
Sistema RAG: FAISS + SentenceTransformers para indexar tu base de conocimientos
Capa de Herramientas: MCP (Model Context Protocol) - FastAPI inicia el servidor MCP como un subproceso y se comunica mediante stdio JSON-RPC
Procesamiento de Currículums: pdfplumber para leer currículums en PDF
Frontend: React

Notas de Implementación MCP

El desarrollador encontró MCP particularmente interesante de construir. MCP es el estándar abierto de Anthropic para conectar IA con herramientas, usando un servidor que puede trabajar con cualquier cliente. El sistema también se conecta a Claude Desktop mediante archivo de configuración, permitiendo que Claude llame directamente a las 9 herramientas.

Un error notable encontrado: MCP SDK v1.x cambió completamente las firmas de los manejadores. El código antiguo pasa un objeto de solicitud completo, mientras que el nuevo código desempaqueta nombre y argumentos directamente. Esto causó un tiempo de depuración significativo.

Salidas del Informe

El sistema genera un informe completo de inteligencia profesional que incluye:

Análisis del currículum
Identificación de brechas de habilidades
Hoja de ruta de 6 meses
Estrategia salarial
Preparación para entrevistas

Todos los componentes se ejecutan de una vez después de procesar el currículum.

Recursos

El proyecto está disponible en GitHub con un video tutorial. El desarrollador señala que la configuración RAG y el cableado cliente/servidor MCP fueron las partes más difíciles de implementar.

📖 Read the full source: r/LocalLLaMA