Construindo um Agente de Pesquisa Autônomo com C# e LLMs Locais

Veja um novo agente de pesquisa autônomo desenvolvido em C# que utiliza LLMs locais, especificamente Ollama junto com o modelo llama3.1:8b. O agente automatiza o processo de manipulação de URLs gerando consultas de busca, realizando pesquisas na web através da API do Brave Search e extraindo dados relevantes, tudo culminando em um relatório estruturado em markdown.
Detalhes Principais
- O agente aceita uma entrada de tópico, por exemplo, "memória persistente para agentes de IA".
- Ele formula autonomamente 5 a 8 consultas de busca.
- As buscas são executadas via API do Brave Search, e as principais fontes são coletadas e analisadas.
- O agente lê de 8 a 12 fontes e extrai de 5 a 8 descobertas-chave.
- Todos os processamentos de dados são executados localmente usando o modelo Ollama (llama3.1:8b) sem depender das APIs da OpenAI/Anthropic.
- A saída é um relatório em markdown completo com citações.
Desempenho e Arquitetura
A configuração atual roda em um Ryzen 5 5500, apenas com CPU, com 16GB de RAM, levando aproximadamente 15 minutos por ciclo de pesquisa. O desenvolvedor observa que modelos de 3B, como o llama3.2, são inadequados para chamadas de ferramentas, tornando 8B um mínimo necessário para desempenho confiável.
Desafios principais incluem a necessidade de truncar descobertas antes da síntese para evitar que o modelo trave em contextos longos, e chamadas de ferramentas ocasionalmente malformadas mesmo com modelos de 8B, resolvidas tentando novamente com prompts alterados. O agente utiliza SQLite combinado com embeddings para gerenciar memória em escala pessoal, dispensando a necessidade de um banco de dados vetorial.
Stack Tecnológico
- C# / .NET 8
- Ollama
- SQLite
- API do Brave Search (camada gratuita)
Para desenvolvedores interessados em construir seu próprio agente, há um kit inicial e um guia de 8 capítulos disponíveis no repositório GitHub do projeto, fornecido sob licença MIT, junto com o código-fonte completo: hex-dynamics.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Editor de Vídeo Cria Ferramenta Gratuita de Transcrição Treelo Usando Código Claude
Um editor de vídeo criou o Treelo, uma ferramenta web gratuita que transcreve arquivos de áudio/vídeo em blocos de timestamp editáveis com predefinições de legendas e exporta para os formatos SRT, VTT, ASS e WAV. A ferramenta foi construída por meio de conversas iterativas com o Claude Code.

Habilidade do Agente Wake para OpenClaw: Notificar o Discord Quando Tarefas Forem Concluídas
Um desenvolvedor criou agent-wake.py, um script Python que o Claude Code executa após a conclusão de tarefas. Ele envia notificações no Discord e dispara eventos de despertar via a API HTTP do gateway, fazendo com que o agente poste resumos automaticamente.

E2a: Gateway de E-mail Open-Source para Agentes de IA com Verificação SPF/DKIM e Entrega via Webhook/WebSocket
E2a é um gateway de e-mail autenticado para agentes de IA que verifica SPF/DKIM em mensagens recebidas, entrega via webhook ou WebSocket e suporta envio de e-mail com aprovação humana intermediária.

Arquitetura de Validação Fria: Sistema de Revisão de Código com Agente Duplo em Código Aberto
Sistema de código aberto utiliza dois agentes de IA separados para validação de código: um constrói o código, outro o revisa sem nenhum contexto sobre o raciocínio do construtor. O revisor vê apenas documentos de planejamento, diferenças de código e saídas de teste.