Suporte do MCP Integrado ao llama.cpp com Novos Recursos de Interface Web

✍️ OpenClawRadar📅 Publicado: March 7, 2026🔗 Source
Suporte do MCP Integrado ao llama.cpp com Novos Recursos de Interface Web
Ad

O pull request do Model Context Protocol (MCP) para o llama.cpp foi mesclado no repositório principal. Esta integração adiciona suporte ao MCP aos componentes llama-server e WebUI, permitindo várias novas capacidades para agentes de programação de IA e fluxos de trabalho de LLM locais.

Principais Funcionalidades Adicionadas

De acordo com o material fonte, esta mesclagem desbloqueia as seguintes funcionalidades:

  • Suporte ao MCP para llama-server/WebUI
  • Capacidade de chamadas de ferramentas
  • Implementação de loop agentivo
  • Funcionalidade de seletor de servidor
  • Gerenciamento de recursos
  • Anexos de prompt
  • Navegador de arquivos/recursos
  • Proxy CORS de backend habilitado com a flag --webui-mcp-proxy
Ad

Detalhes Técnicos

O pull request específico que foi mesclado é PR #18655 no repositório llama.cpp. O colaborador menciona usar OpenWebUI em combinação com llama.cpp WebUI e estava antecipando esta mesclagem.

Para desenvolvedores que trabalham com LLMs locais e agentes de programação de IA, esta integração significa que agora você pode usar ferramentas compatíveis com MCP diretamente através da interface WebUI do llama.cpp. A flag --webui-mcp-proxy habilita a funcionalidade de proxy CORS para o backend, o que é particularmente útil para interfaces baseadas na web.

Esta atualização é principalmente para desenvolvedores que usam llama.cpp para inferência de LLM local e desejam integrar ferramentas compatíveis com MCP em seu fluxo de trabalho através da interface WebUI.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Desenvolvedor do OpenClaw constrói sistema de memória unificado para agentes de IA
Tools

Desenvolvedor do OpenClaw constrói sistema de memória unificado para agentes de IA

Um desenvolvedor criou um sistema unificado de memória com 15 ferramentas para agentes de IA OpenClaw que combina fatos estruturados, busca vetorial, grafos de entidades, linhas do tempo de episódios, compressão hierárquica e coordenação orientada a eventos. O sistema funciona localmente sem dependências de nuvem ou taxas mensais.

OpenClawRadar
Steelman R5: Modelo de 14B Ajustado Supera o Claude Opus na Geração de Código Ada
Tools

Steelman R5: Modelo de 14B Ajustado Supera o Claude Opus na Geração de Código Ada

Um desenvolvedor ajustou o Qwen2.5-Coder-14B-Instruct usando QLoRA em um conjunto de dados verificado por compilador com 3.430 pares de instruções Ada/SPARK, alcançando uma taxa de compilação de 68,6% em um benchmark personalizado, contra 42,1% do Claude Opus 4.6. O modelo está disponível via Ollama e cabe em 12GB de VRAM.

OpenClawRadar
Engram v1.0.0: Memória Persistente para LLMs Locais via Grafo de Conhecimento
Tools

Engram v1.0.0: Memória Persistente para LLMs Locais via Grafo de Conhecimento

Engram é um binário único que fornece memória persistente para LLMs locais através de um sistema de grafo de conhecimento. Inclui um servidor MCP para integração com Claude Code, Cursor e Windsurf, armazena todos os dados em um único arquivo .brain e funciona totalmente offline.

OpenClawRadar
PhAIL Benchmark Testa Modelos VLA em Tarefas Reais de Robôs de Armazém
Tools

PhAIL Benchmark Testa Modelos VLA em Tarefas Reais de Robôs de Armazém

PhAIL é um benchmark de robôs reais que testa quatro modelos visão-linguagem-ação na separação de pedidos de caixa para caixa usando um robô Franka FR3. O melhor modelo alcançou 64 unidades por hora, em comparação com 330 UPH para teleoperação humana e mais de 1.300 UPH para trabalho manual humano.

OpenClawRadar