Mentor de Carreras Multi-Agente Desarrollado con Ollama y MCP para IA Local

Un desarrollador ha construido un sistema de IA multiagente llamado "AI Career Mentor" que lee currículums y produce informes completos de inteligencia profesional. El sistema funciona completamente de forma local usando Ollama con llama3, sin necesidad de claves API ni costos externos.
Arquitectura Técnica
El sistema consta de cinco agentes especializados que encadenan sus salidas:
- Cada agente recibe la salida del agente anterior como contexto compartido
- El agente de hoja de ruta conoce tus brechas de habilidades del agente de análisis
- El agente de salario conoce tu hoja de ruta del agente anterior
- Este encadenamiento hace que el informe sea progresivamente más inteligente a medida que avanza por la tubería
Detalles del Stack Tecnológico
- Motor de IA: Ollama + llama3 (100% local)
- Sistema RAG: FAISS + SentenceTransformers para indexar tu base de conocimientos
- Capa de Herramientas: MCP (Model Context Protocol) - FastAPI inicia el servidor MCP como un subproceso y se comunica mediante stdio JSON-RPC
- Procesamiento de Currículums: pdfplumber para leer currículums en PDF
- Frontend: React
Notas de Implementación MCP
El desarrollador encontró MCP particularmente interesante de construir. MCP es el estándar abierto de Anthropic para conectar IA con herramientas, usando un servidor que puede trabajar con cualquier cliente. El sistema también se conecta a Claude Desktop mediante archivo de configuración, permitiendo que Claude llame directamente a las 9 herramientas.
Un error notable encontrado: MCP SDK v1.x cambió completamente las firmas de los manejadores. El código antiguo pasa un objeto de solicitud completo, mientras que el nuevo código desempaqueta nombre y argumentos directamente. Esto causó un tiempo de depuración significativo.
Salidas del Informe
El sistema genera un informe completo de inteligencia profesional que incluye:
- Análisis del currículum
- Identificación de brechas de habilidades
- Hoja de ruta de 6 meses
- Estrategia salarial
- Preparación para entrevistas
Todos los componentes se ejecutan de una vez después de procesar el currículum.
Recursos
El proyecto está disponible en GitHub con un video tutorial. El desarrollador señala que la configuración RAG y el cableado cliente/servidor MCP fueron las partes más difíciles de implementar.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

TigrimOS v1.1.0 y Tiger CoWork v0.5.0 lanzados con enjambres de agentes remotos y gobernanza configurable.
TigrimOS v1.1.0 y Tiger CoWork v0.5.0, lanzados hoy, añaden comunicación entre enjambres de instancias remotas y cinco protocolos de gobernanza configurables. Ambos son autohospedados, gratuitos y de código abierto.

FOMOE Permite la Inferencia del Modelo Qwen3.5 de 397B en Hardware de Escritorio de $2,100
FOMOE (Fast Opportunistic Mixture of Experts) permite ejecutar el modelo insignia de Qwen3.5 de 397 mil millones de parámetros a 5-9 tokens/segundo en hardware de consumo utilizando dos GPU de $500, 32GB de RAM y una unidad NVMe con cuantización Q4_K_M.

VSCode-Perplexity-MCP: Usa tu cuenta de Perplexity para búsqueda gratuita de IA en VS Code
Un servidor MCP de código abierto que te permite conectar tu cuenta de Perplexity.ai a VS Code, brindando a Clawbot capacidades de búsqueda, razonamiento y cómputo sin pagar por solicitud de API.

ClawMetry: Panel de Observabilidad de Código Abierto para Agentes OpenClaw
ClawMetry es un panel de observabilidad de código abierto para agentes OpenClaw que proporciona actividad de sesión en vivo, seguimiento de costos de tokens, detección de cambios en archivos de memoria y alertas de sesiones bloqueadas. Se ejecuta localmente con pip install clawmetry y fue construido utilizando OpenClaw mismo.