Soporte para MCP integrado en llama.cpp con nuevas funciones de la interfaz web

La solicitud de incorporación de cambios (pull request) del Model Context Protocol (MCP) para llama.cpp ha sido fusionada en el repositorio principal. Esta integración añade soporte para MCP a los componentes llama-server y WebUI, permitiendo varias nuevas capacidades para agentes de codificación con IA y flujos de trabajo de LLM locales.
Características Clave Añadidas
Según el material fuente, esta fusión desbloquea la siguiente funcionalidad:
- Soporte para MCP en llama-server/WebUI
- Capacidad de llamadas a herramientas
- Implementación de bucle agéntico
- Funcionalidad de selector de servidor
- Gestión de recursos
- Adjuntos de prompts
- Explorador de archivos/recursos
- Proxy CORS del backend habilitado con la bandera
--webui-mcp-proxy
Detalles Técnicos
La solicitud de incorporación de cambios específica que se fusionó es PR #18655 en el repositorio de llama.cpp. El colaborador menciona usar OpenWebUI en combinación con llama.cpp WebUI y anticipaba esta fusión.
Para desarrolladores que trabajan con LLM locales y agentes de codificación con IA, esta integración significa que ahora puedes usar herramientas compatibles con MCP directamente a través de la interfaz WebUI de llama.cpp. La bandera --webui-mcp-proxy habilita la funcionalidad de proxy CORS para el backend, lo cual es particularmente útil para interfaces basadas en web.
Esta actualización es principalmente para desarrolladores que usan llama.cpp para inferencia de LLM local y desean integrar herramientas compatibles con MCP en su flujo de trabajo a través de la interfaz WebUI.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Complemento de Estudio de Diseño para Claude Code Agrega Equipo de Diseño Virtual con 9 Roles y 16 Comandos
Un nuevo complemento de Claude Code llamado Design Studio simula un equipo de diseño completo con 9 roles especializados, 16 comandos de barra y 5 agentes. Detecta automáticamente las pilas tecnológicas e incluye más de 8,000 líneas de conocimiento de diseño en archivos de referencia.

Búsqueda de Sesiones: Búsqueda de Texto Completo Local para Sesiones de Claude Code y Codex, Ahora en la Barra de Menú
Session Search indexa transcripciones locales de Claude Code y Codex utilizando SQLite FTS, permitiendo una búsqueda profunda de texto completo entre errores, comandos, nombres de archivo y decisiones, accesible desde la barra de menú de macOS con fragmentos resaltados.

altRAG: Reemplaza la base de datos vectorial RAG con archivos de puntero de 2KB para agentes de IA de codificación
altRAG es una herramienta de Python que reemplaza las bases de datos vectoriales RAG con archivos de punteros ligeros. Escanea archivos de habilidades en Markdown/YAML para crear un archivo esqueleto de 2KB que mapea secciones a números de línea exactos y desplazamientos de bytes, permitiendo que los agentes de IA lean solo las secciones necesarias en lugar de archivos completos.
Enjambre de Espinas: Sistema de IA Multiagente en Lienzo Visual para Proyectos sin Programación
Spine Swarm es un sistema multiagente que funciona en un lienzo visual infinito para completar proyectos complejos que no requieren codificación, como análisis competitivo, modelado financiero, auditorías SEO, presentaciones de lanzamiento y prototipos interactivos. El sistema utiliza bloques como abstracciones sobre los modelos de IA que pueden conectarse para pasar contexto entre diferentes tipos de modelos.