Construyendo un Agente de Investigación Autónomo con C# y LLMs Locales

A continuación, se presenta un nuevo agente de investigación autónomo construido en C# que utiliza LLM locales, específicamente Ollama junto con el modelo llama3.1:8b. El agente automatiza el proceso de manejo de URL generando consultas de búsqueda, realizando búsquedas web a través de la API de Brave Search y extrayendo datos relevantes, todo culminando en un informe estructurado en markdown.
Detalles Clave
- El agente acepta una entrada de tema, por ejemplo, "memoria persistente para agentes de IA".
- Formula de manera autónoma entre 5 y 8 consultas de búsqueda.
- Las búsquedas se ejecutan a través de la API de Brave Search, y se obtienen y analizan las principales fuentes.
- El agente revisa entre 8 y 12 fuentes y extrae de 5 a 8 hallazgos clave.
- Todo el procesamiento de datos se ejecuta localmente utilizando el modelo Ollama (llama3.1:8b) sin depender de las API de OpenAI/Anthropic.
- La salida es un informe en markdown completo con citas.
Rendimiento y Arquitectura
La configuración actual funciona en un Ryzen 5 5500, solo CPU, con 16GB de RAM, tomando aproximadamente 15 minutos por ciclo de investigación. El desarrollador señala que los modelos de 3B, como llama3.2, son inadecuados para llamadas a herramientas, haciendo que 8B sea un mínimo necesario para un rendimiento confiable.
Los desafíos clave incluyen la necesidad de truncar hallazgos antes de la síntesis para evitar que el modelo se detenga en contextos largos, y llamadas a herramientas ocasionalmente mal formadas incluso con modelos de 8B, que se resuelven volviendo a intentar con mensajes alterados. El agente utiliza SQLite emparejado con embeddings para gestionar la memoria a una escala personal, lo que elimina la necesidad de una base de datos vectorial.
Pila Tecnológica
- C# / .NET 8
- Ollama
- SQLite
- API de Brave Search (nivel gratuito)
Para los desarrolladores interesados en construir su propio agente, hay un kit de inicio y una guía de 8 capítulos disponibles en el repositorio de GitHub del proyecto, proporcionados bajo la licencia MIT, junto con el código fuente completo: hex-dynamics.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

La Aplicación de Viajes Gullivr se Integra con Claude a través de un Servidor MCP Remoto
Un desarrollador creó Gullivr, una aplicación de planificación de viajes con un servidor MCP remoto que permite a Claude crear y gestionar viajes directamente dentro de la aplicación. La integración permite actualizaciones en tiempo real mientras se chatea con Claude, eliminando la copia manual entre herramientas.

Qhatu: Plataforma Convierte Repositorios de GitHub en Micro SaaS de Pago por Uso con Claude
Qhatu es una plataforma que toma un repositorio de GitHub y lo despliega como un micro SaaS de pago por uso con un frontend generado y procesamiento de pagos integrado. El sistema utiliza APIs de Anthropic para analizar código, generar Dockerfiles y crear interfaces de tienda.

Brainstorm MCP Server: Permite que Claude Consulte a Otros LLMs para Obtener Mejores Respuestas
Un desarrollador construyó un servidor MCP que permite a Claude Code consultar con otros modelos de IA como GPT-5.2 y DeepSeek antes de proporcionar respuestas. Los modelos participan en debates de múltiples rondas donde leen las respuestas de los demás, discrepan y refinan sus posiciones para converger en mejores soluciones.

clarp: Reemplazo gratuito y de código abierto para Claude - Precios por consumo antes del 15 de junio
Claude -p adopta precios por consumo el 15 de junio. clarp es un CLI open source que lo reemplaza para flujos locales — solo cambia el nombre del binario de claude a clarp.