Estado de las herramientas locales de investigación profunda: GPT Researcher y Local Deep Research lideran, proyectos STORM y LangChain estancados

En mayo de 2026, una encuesta comunitaria en r/LocalLLaMA evaluó las principales herramientas locales de investigación profunda de código abierto. Los dos proyectos más saludables son GPT Researcher de assafelovic y Local Deep Research de LearningCircuit. Otros como STORM de Stanford y Open Deep Research de LangChain parecen abandonados o mal mantenidos.
GPT Researcher (assafelovic)
- Estado: Semi-vivo; último commit hace 3 semanas. Mal mantenido, con muchas ramas obsoletas.
- Contribuidores: 211
- Issues: 173 abiertos (casi sin respuesta a issues de 2026), 511 cerrados (mayoría correcciones).
- PRs: 44 abiertos (algunos con 6 meses sin revisión), 785 cerrados (60-70% fusionados).
- Tecnología: Python + TypeScript. Usa MCP para búsqueda en internet y web scraping a través de un repositorio separado gptr-mcp que depende de una API de terceros.
- Enlaces: GitHub, Docs, Sitio web
Local Deep Research (LearningCircuit)
- Estado: Vivo; último commit ayer. Contribuidores medios (46).
- Issues: 75 abiertos (mitad por contribuidor, mitad por usuarios sin comentarios durante meses), 254 cerrados (muchos auto-reportados).
- PRs: 161 abiertos (muchos por contribuidor, pendientes durante semanas), 3309 cerrados (95% por contribuidor o dependabot).
- Tecnología: Python. Usa SearXNG.
- Enlaces: GitHub, Benchmarks, Subreddit
STORM (Stanford)
- Estado: Abandonado; último commit hace 8 meses. Contribuidores pequeños (23).
- Issues: 58 abiertos (muchos reportes de errores sin respuestas), 164 cerrados (mayoría sin resolución como "no planeado").
- PRs: 60 abiertos (mayoría sin respuestas), 111 cerrados (solo cancelados en los últimos 2 años).
- Tecnología: Python. Soporta múltiples servicios de recuperación: YouRM, BingSearch, VectorRM, SerperRM, BraveRM, SearXNG, DuckDuckGoSearchRM, TavilySearchRM, GoogleSearch, AzureAISearch.
- Enlaces: GitHub, Sitio web
Local Deep Research (LangChain)
- Estado: Semi-vivo; último commit hace 2 semanas. Contribuidores pequeños (14).
- Issues: 36 abiertos (muchos sin respuesta), 39 cerrados (con soluciones).
- PRs: 6 abiertos (algunos pendientes más de un año), 48 cerrados (mayoría dependabot, sin contribuciones de usuarios recientes).
- Tecnología: Python. DuckDuckGo, SearXNG + proveedores comerciales.
- Enlaces: GitHub
Open Deep Research (LangChain)
- Estado: Abandonado; último trabajo de desarrollo humano en agosto 2025. Contribuidores pequeños (26).
- Issues: 34 abiertos (sin respuestas desde noviembre 2025), 95 cerrados.
- PRs: 24 abiertos (sin comentarios/revisiones), 114 cerrados (contribuciones comunitarias mayormente descartadas).
- Tecnología: Python + Jupyter notebook. Sin información del motor de búsqueda.
- Enlaces: GitHub
Open Deep Research (Together)
- Estado: Abandonado; último commit hace un año, solo 3 commits en total. 1 contribuidor, sin issues ni PRs.
- Tecnología: Python, depende de TAVILY para búsqueda web.
- Enlaces: GitHub, Blogpost
La comunidad señala confusión sobre por qué LangChain mantiene dos proyectos de nombres similares ("Local Deep Research" y "Open Deep Research") sin documentación sobre su relación. Para desarrolladores que buscan herramientas de investigación local activamente mantenidas, GPT Researcher y Local Deep Research de LearningCircuit son actualmente las opciones más viables.
📖 Lee la fuente completa: r/LocalLLaMA
👀 Ver también

Blindspot MCP: Un Cerebro Externo para Agentes de IA de Programación
Blindspot MCP es una herramienta que indexa bases de código completas utilizando tree-sitter y SQLite para ayudar a los agentes de IA de codificación a comprender símbolos, dependencias y relaciones entre archivos, evitando cambios que rompan el código fuera de su contexto inmediato.

El Servidor MCP de Octopoda Agrega Memoria Persistente, Detección de Bucles y Trazas de Auditoría a Claude Code
Un desarrollador creó Octopoda, un servidor MCP que se integra con Claude Code para proporcionar memoria persistente, detección de bucles, registros de auditoría y espacios de conocimiento compartido para agentes de IA. El sistema utiliza PostgreSQL con pgvector para búsqueda semántica, FastAPI y un panel de control en React.

Benchmark Muestra que la Herramienta CLI Reduce los Costos de Tokens de Código de Claude en un 32% Mediante Navegación Estructural
Un desarrollador creó una herramienta CLI en Rust que proporciona a los agentes Claude Code comandos de navegación estructural como 'muéstrame un resumen de 180 tokens de esta clase de 6,000 tokens'. La evaluación comparativa en Sonnet 4.6 a lo largo de 54 ejecuciones automatizadas mostró un 32% menos de costo por tarea y un 67% más de ediciones de código por sesión.

Pérdida de datos de la sesión de Claude Code: Script de respaldo para Windows y Mac
Usuarios reportan pérdida silenciosa de datos de sesión en Claude Code. Aquí un script de respaldo automático y gratuito para Windows y Mac usando PowerShell y launchd.