MCP-Unterstützung in llama.cpp integriert mit neuen WebUI-Funktionen

✍️ OpenClawRadar📅 Veröffentlicht: 7. März 2026🔗 Source
MCP-Unterstützung in llama.cpp integriert mit neuen WebUI-Funktionen
Ad

Der Pull Request für das Model Context Protocol (MCP) für llama.cpp wurde in das Haupt-Repository gemerged. Diese Integration fügt MCP-Unterstützung zu den Komponenten llama-server und WebUI hinzu und ermöglicht mehrere neue Funktionen für KI-Coding-Agenten und lokale LLM-Workflows.

Hinzugefügte Hauptfunktionen

Laut dem Quellenmaterial erschließt dieses Merge folgende Funktionalität:

  • MCP-Unterstützung für llama-server/WebUI
  • Tool-Aufrufe-Fähigkeit
  • Implementierung einer agentischen Schleife
  • Server-Selektor-Funktionalität
  • Ressourcenverwaltung
  • Prompt-Anhänge
  • Datei-/Ressourcen-Browser
  • Backend-CORS-Proxy aktiviert mit dem --webui-mcp-proxy-Flag
Ad

Technische Details

Der spezifische Pull Request, der gemerged wurde, ist PR #18655 im llama.cpp-Repository. Der Beitragende erwähnt die Verwendung von OpenWebUI in Kombination mit llama.cpp WebUI und hatte dieses Merge erwartet.

Für Entwickler, die mit lokalen LLMs und KI-Coding-Agenten arbeiten, bedeutet diese Integration, dass Sie nun MCP-kompatible Tools direkt über die llama.cpp WebUI-Oberfläche nutzen können. Das --webui-mcp-proxy-Flag aktiviert die CORS-Proxy-Funktionalität für das Backend, was besonders für webbasierte Oberflächen nützlich ist.

Dieses Update richtet sich hauptsächlich an Entwickler, die llama.cpp für lokale LLM-Inferenz verwenden und MCP-kompatible Tools über die WebUI-Oberfläche in ihren Workflow integrieren möchten.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Aufbau eines selbstverbessernden Traumzyklus mit Cron-Jobs und Claude
Werkzeuge

Aufbau eines selbstverbessernden Traumzyklus mit Cron-Jobs und Claude

Ein Entwickler baute einen autonomen Traumzyklus mit zwei Cron-Jobs: einer um 22:30 Uhr für Recherche und Reflexion und ein weiterer um 23:00 Uhr für Überprüfung und Planung. Das System durchsucht arXiv, GitHub Trending und Reddit, identifiziert Schwachstellen und schlägt konkrete Verbesserungen vor.

OpenClawRadar
VoidLLM: Zero-Knowledge-Proxy für Ollama und vLLM mit Team-Zugriffskontrolle
Werkzeuge

VoidLLM: Zero-Knowledge-Proxy für Ollama und vLLM mit Team-Zugriffskontrolle

VoidLLM ist ein Proxy, der zwischen Anwendungen und lokalen LLM-Servern wie Ollama und vLLM sitzt. Er fügt Organisations-/Team-Zugriffskontrolle, API-Schlüsselverwaltung, Nutzungsverfolgung und Ratenbegrenzung hinzu, ohne die Prompts einzusehen. Er hat einen Proxy-Overhead von <2ms und funktioniert mit OpenAI-kompatiblen SDKs.

OpenClawRadar
ByteRover-Speicher-Plugin für OpenClaw: Native Integration mit semantischer Hierarchie
Werkzeuge

ByteRover-Speicher-Plugin für OpenClaw: Native Integration mit semantischer Hierarchie

Das ByteRover Memory Plugin für OpenClaw bietet native, strukturierte Langzeitspeicherung über eine dreischichtige Architektur und semantische Hierarchie, die in Markdown-Dateien gespeichert wird. Es erreicht 92,2 % Abrufgenauigkeit und erfordert OpenClaw v2026.3.22+.

OpenClawRadar
Stoppen Sie, Claude Code in jeder Sitzung neu zu unterrichten: Verwenden Sie eine persistente Konfiguration
Werkzeuge

Stoppen Sie, Claude Code in jeder Sitzung neu zu unterrichten: Verwenden Sie eine persistente Konfiguration

Ein Reddit-Benutzer erklärt, wie er durch das Schreiben einer persistenten Konfiguration für Claude Code 20 Minuten pro Sitzung sparte, wiederholtes Steuern eliminierte und 33 % schnellere Abschlüsse erreichte.

OpenClawRadar