ScreenMind: Memoria de IA Local que Indexa Toda tu Actividad Informática

ScreenMind es un sistema de memoria local con IA que captura continuamente tu pantalla, transcribe reuniones e indexa notas de voz, creando una línea de tiempo persistente y buscable de todo lo que haces en tu computadora. Usa hashing perceptual para activarse solo cuando el contenido cambia, luego procesa cada fotograma con Gemma 4 E2B a través de llama.cpp para análisis visual, chat y procesamiento de audio.
Características principales
- Captura de pantalla con hashing perceptual — solo almacena fotogramas cuando el contenido realmente cambia
- Línea de tiempo buscable — consulta actividad pasada: "ese mensaje de error de antes", "¿en qué estaba trabajando a las 3 p.m.?"
- Chatea con tu historial — contexto persistente de IA de toda tu sesión
- Transcripción de reuniones — detecta automáticamente Zoom, Teams y Google Meet
- Notas de voz — procesadas mediante el codificador de audio de Gemma 4
- Automatizaciones en lenguaje natural — escríbelas en Markdown en inglés sencillo
- Integración MCP — conéctate a Claude y Cursor
Stack técnico
- Modelos: Gemma 4 E2B (maneja visión, chat, audio)
- Backend: Python + FastAPI
- Almacenamiento: SQLite
- Inferencia: llama.cpp con cuantización Q4
- Hardware: 4GB+ VRAM
El autor señala que la planificación de GPU entre tareas de visión, chat y audio es el principal desafío de optimización de inferencia. El proyecto aún está impulsado por flujos de trabajo, no es completamente autónomo; la calidad de recuperación y la fricción de incorporación son áreas que necesitan mejora.
GitHub: ayushh0110/ScreenMind
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Agentes & A.I.mpires: Juego de Estrategia Donde los Agentes de IA Juegan y los Humanos Espectan
Agents & A.I.mpires es un juego de estrategia en tiempo real persistente en un globo con cuadrícula hexagonal donde los agentes de IA reclaman territorio de forma autónoma, atacan, forman alianzas y escriben blogs de guerra diarios mediante llamadas a la API HTTP. Los humanos solo observan el comportamiento emergente.

Toroidal Logit Bias: Truco simple en inferencia reduce alucinaciones en 40%
Un nuevo metodo mapea tokens a un toro y refuerza logits cercanos, reduciendo errores sin fine-tuning o RAG.

Inferencia LLM soberana del Reino Unido: Relax.ai publica documentos públicos
Relax.ai publicó documentación para inferencia de LLM soberana del Reino Unido, redirigiendo a /docs/getting-started/introduction. El servicio se compartió en HN con 104 puntos.

TechDebtMCP v2.0.0: Servidor MCP para análisis de deuda técnica en 14 idiomas
TechDebtMCP v2.0.0 es un servidor MCP que conecta Claude a bases de código para encontrar, medir y priorizar deuda técnica en 14 lenguajes de programación, incluyendo JS/TS, Python, Java, Swift, Kotlin, Go, Rust, C/C++, C#, Ruby y PHP.