Fluxo de Trabalho de Agente de IA Local Usando OpenCode, FastMCP e DeepSeek-r1

✍️ OpenClawRadar📅 Publicado: March 25, 2026🔗 Source
Fluxo de Trabalho de Agente de IA Local Usando OpenCode, FastMCP e DeepSeek-r1
Ad

Um desenvolvedor no r/LocalLLaMA descreve como foi além de usar LLMs como "autocompletar glorificado" implementando um fluxo de trabalho de agentes locais com OpenCode, FastMCP e o modelo DeepSeek-r1.

Padrão AGENTS.md para Prompts Determinísticos

O desenvolvedor usa um arquivo AGENTS.md como um manual determinístico que injeta regras rígidas no prompt de sistema da IA. Exemplos incluem "Use Python 3.9, formate com Ruff, absolutamente nenhuma variável global." Essa abordagem visa eliminar alucinações desde o início.

Subagentes Locais com DeepSeek-r1

Em vez de usar APIs em nuvem como Claude ou GPT-4o para tarefas triviais, eles configuraram Ollama com o modelo gratuito deepseek-r1. Criaram subagentes específicos, como um para testes definido em um arquivo pytest.md. Configurações-chave incluem:

  • Temperatura definida para 0.1
  • Ferramentas restritas: "pytest": true e "bash": false

Isso permite que a IA execute conjuntos de testes de forma autônoma, leia tracebacks e corrija erros de sintaxe, enquanto é impedida de executar comandos potencialmente perigosos como rm -rf.

Ad

FastMCP para Exposição Padronizada de Funções Locais

FastMCP é descrito como "o 'USB-C' da IA" — semelhante ao FastAPI, mas para agentes de IA. Com cerca de 5 linhas de Python, você pode iniciar um servidor local para expor funções locais seguras (como consultar um banco de dados de desenvolvimento) de maneira padronizada que qualquer agente OpenCode pode consumir.

Uma dica de implementação crítica: direcione todos os logs do Python para stderr porque o protocolo MCP é executado via stdio. Deixar uma instrução print() padrão pode corromper o pacote JSON-RPC e interromper a conexão.

O desenvolvedor observa que gravou um vídeo codificando toda essa arquitetura do zero e configurando o ambiente local em cerca de 15 minutos.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Claude Code Studio: Aplicativo de Desktop de Código Aberto para Gerenciar Múltiplas Sessões de Codificação do Claude
Tools

Claude Code Studio: Aplicativo de Desktop de Código Aberto para Gerenciar Múltiplas Sessões de Codificação do Claude

Claude Code Studio v0.9.3 é um aplicativo de desktop de código aberto que fornece uma interface multi-painel para gerenciar várias sessões do Claude Code CLI. Ele aborda problemas comuns de fluxo de trabalho como alternar entre abas do terminal, persistência de sessões e repetição de instruções.

OpenClawRadar
Aplicativo de Desktop do Claude com Função de Colaboração Permite Comunicação IA-para-IA via Google Docs Compartilhados
Tools

Aplicativo de Desktop do Claude com Função de Colaboração Permite Comunicação IA-para-IA via Google Docs Compartilhados

Usuários implementaram com sucesso a comunicação Claude-para-Claude usando a nova função de colaboração no aplicativo de desktop, com dois agentes de IA lendo e escrevendo em um Google Doc compartilhado em um diálogo estruturado de cinco trocas.

OpenClawRadar
Claude Desktop + Blender via MCP: Fluxo de Trabalho 3D em Tempo Real Fecha o Ciclo de Feedback
Tools

Claude Desktop + Blender via MCP: Fluxo de Trabalho 3D em Tempo Real Fecha o Ciclo de Feedback

Um add-on de código aberto do Blender executa um servidor MCP dentro do Blender, permitindo que o Claude Desktop inspecione cenas, crie objetos, renderize imagens e leia resultados—fechando o ciclo de feedback de copiar e colar scripts.

OpenClawRadar
Semble: Busca de Código para Agentes de IA Usando 98% Menos Tokens que grep+read
Tools

Semble: Busca de Código para Agentes de IA Usando 98% Menos Tokens que grep+read

Semble é uma biblioteca de busca de código open-source para agentes de IA que combina embeddings estáticos Model2Vec com BM25, executando inteiramente em CPU. Ela indexa um repositório em ~250ms e responde a consultas em ~1.5ms, alcançando 0.854 NDCG@10 — 99% da qualidade de um transformer de 137M de parâmetros — enquanto usa 98% menos tokens do que grep+read.

OpenClawRadar