Mehr-Agenten-Karriere-Mentor entwickelt mit Ollama und MCP für lokale KI

Ein Entwickler hat ein Multi-Agenten-KI-System namens "AI Career Mentor" gebaut, das Lebensläufe liest und umfassende Karriere-Intelligenzberichte erstellt. Das System läuft vollständig lokal mit Ollama und llama3, benötigt keine API-Schlüssel und verursacht keine externen Kosten.
Technische Architektur
Das System besteht aus fünf spezialisierten Agenten, die ihre Ausgaben verkettet weitergeben:
- Jeder Agent erhält die Ausgabe des vorherigen Agenten als gemeinsamen Kontext
- Der Roadmap-Agent kennt Ihre Kompetenzlücken vom Analyse-Agenten
- Der Gehalts-Agent kennt Ihre Roadmap vom vorherigen Agenten
- Diese Verkettung macht den Bericht im Verlauf der Pipeline zunehmend intelligenter
Tech-Stack-Details
- KI-Engine: Ollama + llama3 (100 % lokal)
- RAG-System: FAISS + SentenceTransformers zur Indizierung Ihrer Wissensdatenbank
- Tool-Schicht: MCP (Model Context Protocol) – FastAPI startet den MCP-Server als Subprozess und kommuniziert über stdio JSON-RPC
- Lebenslauf-Verarbeitung: pdfplumber zum Lesen von PDF-Lebensläufen
- Frontend: React
MCP-Implementierungshinweise
Der Entwickler fand den Aufbau mit MCP besonders interessant. MCP ist der offene Standard von Anthropic, um KI mit Tools zu verbinden, wobei ein Server mit jedem Client arbeiten kann. Das System verbindet sich auch über eine Konfigurationsdatei mit Claude Desktop, sodass Claude alle 9 Tools direkt aufrufen kann.
Ein bemerkenswerter Fehler, auf den man stieß: MCP SDK v1.x änderte die Handler-Signaturen vollständig. Alte Code übergibt ein vollständiges Request-Objekt, während neuer Code Name und Argumente direkt entpackt. Dies verursachte erhebliche Debugging-Zeit.
Berichtsausgaben
Das System generiert einen vollständigen Karriere-Intelligenzbericht, der Folgendes umfasst:
- Lebenslaufanalyse
- Identifizierung von Kompetenzlücken
- 6-Monats-Roadmap
- Gehaltsstrategie
- Vorbereitung auf Vorstellungsgespräche
Alle Komponenten laufen in einem Durchgang nach der Verarbeitung des Lebenslaufs.
Ressourcen
Das Projekt ist auf GitHub mit einer Videoanleitung verfügbar. Der Entwickler merkt an, dass die RAG-Einrichtung und die MCP-Client/Server-Verknüpfung die kniffligsten Teile der Implementierung waren.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

2026 Hermes-Agent-Alternativen-Rundumblick: Selbstgehostete Optionen von OpenClaw bis memU Bot
Ein Entwickler, der Hermes seit dem Start betreibt, hat nach dem ClawHub-Sicherheitsdebakel jede selbst gehostete und verwaltete Alternative getestet. Wichtige Ergebnisse: OpenClaw (370.000 Stars) aber 9 CVEs in 4 Tagen und ~20 % bösartige Pakete; TrustClaw mit OAuth/Sandboxing neu aufgebaut; nanobot mit ~4.000 Zeilen Python und MCP; memU Bot mit einzigartigem strukturiertem Gedächtnis. Verwaltete Optionen umfassen Perplexity Computer (19 Modelle, 200 $/Monat), Claude Cowork (öffnet echte Mac-Apps) und KimiClaw (40 GB RAG, an K2.5 gebunden, chinesisches Datenschutzrecht). Vollständige Übersicht unter der Quelle.

MTPLX: 2,24x schnellere Token auf Apple Silicon mit nativen MTP-Köpfen
MTPLX erreicht 63 tok/s auf Qwen3.6-27B auf M5 Max (von 28 tok/s) unter Verwendung der integrierten MTP-Köpfe mit exakten Temperatur-Sampling und ohne externen Drafter.

PageAgent: Browser-AI-Agent, der innerhalb von Webseiten mit Ollama-Unterstützung läuft
PageAgent ist eine JavaScript-Bibliothek, die KI-Agenten direkt innerhalb von Webseiten ausführt und dabei den Live-DOM als Text liest, anstatt Screenshots zu verwenden. Es funktioniert mit jedem OpenAI-kompatiblen Endpunkt, einschließlich Ollama, und ermöglicht lokale LLM-Aufrufe direkt aus dem Browser.

Cull: Open-Source Dataset Curation Engine für KI-Bildpipelines
Cull extrahiert Bilder aus über 340 Quellen, darunter Civitai, X/Twitter, Reddit, Discord und Booru-Seiten, klassifiziert sie mit einem Vision-Language-Modell über lokales LM Studio oder Groq und sortiert sie in Kategorie-Ordner mit SD-Prompts und Prüfprotokollen.