ScreenMind: Локальный ИИ с памятью, индексирующий всю активность вашего компьютера

ScreenMind — это локальная AI-система памяти, которая непрерывно захватывает ваш экран, транскрибирует встречи и индексирует голосовые заметки, создавая постоянную, доступную для поиска временную шкалу всего, что вы делаете на компьютере. Она использует perceptual hashing, чтобы срабатывать только при изменении контента, затем обрабатывает каждый кадр через Gemma 4 E2B с помощью llama.cpp для анализа изображений, общения и обработки аудио.
Ключевые особенности
- Захват экрана с perceptual hashing — сохраняются только кадры, когда контент реально меняется
- Поиск по временной шкале — запрашивайте прошлую активность: "то сообщение об ошибке ранее", "над чем я работал в 15:00?"
- Общение с историей — постоянный AI-контекст из всей сессии
- Транскрибация встреч — автоматически определяет Zoom, Teams и Google Meet
- Голосовые заметки — обрабатываются аудиоэнкодером Gemma 4
- Автоматизация на естественном языке — пишите их на простом английском в Markdown
- Интеграция MCP — подключение к Claude и Cursor
Технический стек
- Модели: Gemma 4 E2B (обрабатывает зрение, чат, аудио)
- Бэкенд: Python + FastAPI
- Хранилище: SQLite
- Инференс: llama.cpp с Q4-квантованием
- Оборудование: 4 ГБ+ VRAM
Автор отмечает, что планирование GPU между задачами зрения, чата и аудио — основная проблема оптимизации инференса. Проект все еще ориентирован на рабочий процесс, а не полностью автономен — качество поиска и сложность первого запуска требуют улучшений.
GitHub: ayushh0110/ScreenMind
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Сервер MCP реализует принцип рефлексии из научной работы для обеспечения устойчивой памяти агента-кодера.
Разработчик реализовал статью Reflexion (Shinn et al., NeurIPS 2023) в виде MCP-сервера, чтобы предоставить локальным кодирующим агентам устойчивую память об их ошибках. Система использует сопоставление по шаблонам на основе регулярных выражений для сообщений об ошибках и сохраняет уроки в SQLite с FTS5.

Обзор альтернатив Hermes Agent 2026: Самостоятельно размещаемые решения от OpenClaw до memU Bot
Разработчик, использующий Hermes с момента запуска, протестировал все самостоятельно размещенные и управляемые альтернативы после проблем с безопасностью ClawHub. Ключевые находки: OpenClaw (370k звезд), но 9 CVE за 4 дня и ~20% вредоносных пакетов; TrustClaw перестроен с OAuth/песочницей; nanobot ~4K строк на Python с MCP; memU Bot с уникальной структурированной памятью. Управляемые варианты: Perplexity Computer (19 моделей, $200/мес), Claude Cowork (открывает реальные приложения Mac) и KimiClaw (40GB RAG, привязан к K2.5, законы Китая о данных). Полный обзор по ссылке.

motif MCP предоставляет Claude Code возможность просмотра видео для воспроизведения ошибок интерфейса
motif — это MCP-сервер, который позволяет Claude Code просматривать записи экрана с UI-багами, используя покадровый анализ Gemini 2.5 Flash для возврата визуальных описаний, первопричин и диффов. Для настройки нужен ключ Gemini API и две строки в mcp.json.

BottyFans: открытый API для монетизации ИИ-агентов через USDC
Новая платформа позволяет ИИ-агентам вести собственный креаторский бизнес с подписками, донатами и платным контентом в USDC.