MCP-Unterstützung in llama.cpp integriert mit neuen WebUI-Funktionen

Der Pull Request für das Model Context Protocol (MCP) für llama.cpp wurde in das Haupt-Repository gemerged. Diese Integration fügt MCP-Unterstützung zu den Komponenten llama-server und WebUI hinzu und ermöglicht mehrere neue Funktionen für KI-Coding-Agenten und lokale LLM-Workflows.
Hinzugefügte Hauptfunktionen
Laut dem Quellenmaterial erschließt dieses Merge folgende Funktionalität:
- MCP-Unterstützung für llama-server/WebUI
- Tool-Aufrufe-Fähigkeit
- Implementierung einer agentischen Schleife
- Server-Selektor-Funktionalität
- Ressourcenverwaltung
- Prompt-Anhänge
- Datei-/Ressourcen-Browser
- Backend-CORS-Proxy aktiviert mit dem
--webui-mcp-proxy-Flag
Technische Details
Der spezifische Pull Request, der gemerged wurde, ist PR #18655 im llama.cpp-Repository. Der Beitragende erwähnt die Verwendung von OpenWebUI in Kombination mit llama.cpp WebUI und hatte dieses Merge erwartet.
Für Entwickler, die mit lokalen LLMs und KI-Coding-Agenten arbeiten, bedeutet diese Integration, dass Sie nun MCP-kompatible Tools direkt über die llama.cpp WebUI-Oberfläche nutzen können. Das --webui-mcp-proxy-Flag aktiviert die CORS-Proxy-Funktionalität für das Backend, was besonders für webbasierte Oberflächen nützlich ist.
Dieses Update richtet sich hauptsächlich an Entwickler, die llama.cpp für lokale LLM-Inferenz verwenden und MCP-kompatible Tools über die WebUI-Oberfläche in ihren Workflow integrieren möchten.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Aufbau eines selbstverbessernden Traumzyklus mit Cron-Jobs und Claude
Ein Entwickler baute einen autonomen Traumzyklus mit zwei Cron-Jobs: einer um 22:30 Uhr für Recherche und Reflexion und ein weiterer um 23:00 Uhr für Überprüfung und Planung. Das System durchsucht arXiv, GitHub Trending und Reddit, identifiziert Schwachstellen und schlägt konkrete Verbesserungen vor.

VoidLLM: Zero-Knowledge-Proxy für Ollama und vLLM mit Team-Zugriffskontrolle
VoidLLM ist ein Proxy, der zwischen Anwendungen und lokalen LLM-Servern wie Ollama und vLLM sitzt. Er fügt Organisations-/Team-Zugriffskontrolle, API-Schlüsselverwaltung, Nutzungsverfolgung und Ratenbegrenzung hinzu, ohne die Prompts einzusehen. Er hat einen Proxy-Overhead von <2ms und funktioniert mit OpenAI-kompatiblen SDKs.

ByteRover-Speicher-Plugin für OpenClaw: Native Integration mit semantischer Hierarchie
Das ByteRover Memory Plugin für OpenClaw bietet native, strukturierte Langzeitspeicherung über eine dreischichtige Architektur und semantische Hierarchie, die in Markdown-Dateien gespeichert wird. Es erreicht 92,2 % Abrufgenauigkeit und erfordert OpenClaw v2026.3.22+.

Stoppen Sie, Claude Code in jeder Sitzung neu zu unterrichten: Verwenden Sie eine persistente Konfiguration
Ein Reddit-Benutzer erklärt, wie er durch das Schreiben einer persistenten Konfiguration für Claude Code 20 Minuten pro Sitzung sparte, wiederholtes Steuern eliminierte und 33 % schnellere Abschlüsse erreichte.