Configurando Servidores MCP no Web UI do llama-server: Um Guia Prático

✍️ OpenClawRadar📅 Publicado: March 8, 2026🔗 Source
Configurando Servidores MCP no Web UI do llama-server: Um Guia Prático
Ad

O llama-server adicionou recentemente suporte ao MCP (Model Context Protocol), e um usuário do Reddit documentou os passos exatos para fazê-lo funcionar na interface web. Este guia fornece instruções concretas de configuração para desenvolvedores que desejam integrar servidores MCP com sua instância local do llama-server.

Requisitos de Configuração

Primeiro, certifique-se de que o uv está instalado. O guia faz referência à documentação oficial de instalação em https://docs.astral.sh/uv/getting-started/installation/.

Arquivo de Configuração

Crie um arquivo config.json no diretório de sua escolha com definições de servidores MCP. O exemplo inclui três servidores:

{
  "mcpServers": {
    "time": {
      "command": "uv",
      "args": ["run", "mcp-server-time", "--local-timezone=America/Chicago"]
    },
    "fetch": {
      "command": "uvx",
      "args": ["mcp-server-fetch"]
    },
    "ddg-search": {
      "command": "uvx",
      "args": ["duckduckgo-mcp-server"]
    }
  }
}
Ad

Executando o Proxy

Do mesmo diretório, execute este comando:

uvx mcp-proxy --named-server-config config.json --allow-origin "*" --port 8001 --stateless

Ao executar este comando, ele lista o nome de cada servidor MCP. Você precisa substituir o sse no final de cada URL por mcp para que os servidores funcionem na interface web do llama-server.

Exemplo: Altere http://127.0.0.1:8001/servers/time/sse para http://127.0.0.1:8001/servers/time/mcp

Configuração da Interface Web

Na interface web do llama-server, vá para Configurações → MCP → Adicionar Novo Servidor e adicione cada servidor do seu config. Por exemplo:

  • http://127.0.0.1:8001/servers/time/mcp
  • http://127.0.0.1:8001/servers/fetch/mcp
  • http://127.0.0.1:8001/servers/ddg-search/mcp

Clique em Adicionar para finalizar a adição de cada servidor, depois marque a alternância para ativá-lo. Os servidores MCP configurados agora devem funcionar na interface web do llama-server.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Pesquisa Mostra que a Formulação Eficaz de Prompts de IA É Comunicação Cooperativa, Não Engenharia
Guides

Pesquisa Mostra que a Formulação Eficaz de Prompts de IA É Comunicação Cooperativa, Não Engenharia

Pesquisas revisadas por pares indicam que o prompting eficaz com modelos de IA segue os mesmos princípios de comunicação cooperativa que os humanos usam, com a análise da Lakera mostrando que a maioria das falhas de prompt decorre de ambiguidade, não de limitações do modelo.

OpenClawRadar
Configurando o Qwen3.5-27B Localmente: Comparação entre vLLM e llama.cpp
Guides

Configurando o Qwen3.5-27B Localmente: Comparação entre vLLM e llama.cpp

Um usuário do Reddit compartilha dicas práticas para executar o Qwen3.5-27B localmente, comparando os backends llama.cpp e vLLM com recomendações de configuração específicas e resultados de benchmark.

OpenClawRadar
Dividindo o Contexto do Agente em Três Camadas para Resolver o Problema do Monólito de 700 Linhas
Guides

Dividindo o Contexto do Agente em Três Camadas para Resolver o Problema do Monólito de 700 Linhas

Uma equipe construindo um sistema autônomo de 6 agentes resolveu o inchaço de arquivos de contexto separando o contexto do agente em três camadas baseadas no tipo de preocupação e frequência de mudança: CLAUDE.md para identidade, BRIEFING.md para missão e PLAYBOOK.md para operações. Essa abordagem evita falhas silenciosas por limites de argumentos e torna a edição previsível.

OpenClawRadar
O Problema da Voz do LLM: Evitando Padrões de Escrita Gerados por IA
Guides

O Problema da Voz do LLM: Evitando Padrões de Escrita Gerados por IA

Um desenvolvedor discute o problema comum de textos escritos com assistência de LLM apresentarem "LLM-ismos" reconhecíveis que acionam imediatamente a detecção de IA, e compartilha um artigo sobre como identificar esses padrões e editar para autenticidade.

OpenClawRadar