ScreenMind: Локальный ИИ с памятью, индексирующий всю активность вашего компьютера

✍️ OpenClawRadar📅 Опубликовано: 8 июня 2026 г.🔗 Source
ScreenMind: Локальный ИИ с памятью, индексирующий всю активность вашего компьютера
Ad

ScreenMind — это локальная AI-система памяти, которая непрерывно захватывает ваш экран, транскрибирует встречи и индексирует голосовые заметки, создавая постоянную, доступную для поиска временную шкалу всего, что вы делаете на компьютере. Она использует perceptual hashing, чтобы срабатывать только при изменении контента, затем обрабатывает каждый кадр через Gemma 4 E2B с помощью llama.cpp для анализа изображений, общения и обработки аудио.

Ключевые особенности

  • Захват экрана с perceptual hashing — сохраняются только кадры, когда контент реально меняется
  • Поиск по временной шкале — запрашивайте прошлую активность: "то сообщение об ошибке ранее", "над чем я работал в 15:00?"
  • Общение с историей — постоянный AI-контекст из всей сессии
  • Транскрибация встреч — автоматически определяет Zoom, Teams и Google Meet
  • Голосовые заметки — обрабатываются аудиоэнкодером Gemma 4
  • Автоматизация на естественном языке — пишите их на простом английском в Markdown
  • Интеграция MCP — подключение к Claude и Cursor
Ad

Технический стек

  • Модели: Gemma 4 E2B (обрабатывает зрение, чат, аудио)
  • Бэкенд: Python + FastAPI
  • Хранилище: SQLite
  • Инференс: llama.cpp с Q4-квантованием
  • Оборудование: 4 ГБ+ VRAM

Автор отмечает, что планирование GPU между задачами зрения, чата и аудио — основная проблема оптимизации инференса. Проект все еще ориентирован на рабочий процесс, а не полностью автономен — качество поиска и сложность первого запуска требуют улучшений.

GitHub: ayushh0110/ScreenMind

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Сервер MCP реализует принцип рефлексии из научной работы для обеспечения устойчивой памяти агента-кодера.
Инструменты

Сервер MCP реализует принцип рефлексии из научной работы для обеспечения устойчивой памяти агента-кодера.

Разработчик реализовал статью Reflexion (Shinn et al., NeurIPS 2023) в виде MCP-сервера, чтобы предоставить локальным кодирующим агентам устойчивую память об их ошибках. Система использует сопоставление по шаблонам на основе регулярных выражений для сообщений об ошибках и сохраняет уроки в SQLite с FTS5.

OpenClawRadar
Обзор альтернатив Hermes Agent 2026: Самостоятельно размещаемые решения от OpenClaw до memU Bot
Инструменты

Обзор альтернатив Hermes Agent 2026: Самостоятельно размещаемые решения от OpenClaw до memU Bot

Разработчик, использующий Hermes с момента запуска, протестировал все самостоятельно размещенные и управляемые альтернативы после проблем с безопасностью ClawHub. Ключевые находки: OpenClaw (370k звезд), но 9 CVE за 4 дня и ~20% вредоносных пакетов; TrustClaw перестроен с OAuth/песочницей; nanobot ~4K строк на Python с MCP; memU Bot с уникальной структурированной памятью. Управляемые варианты: Perplexity Computer (19 моделей, $200/мес), Claude Cowork (открывает реальные приложения Mac) и KimiClaw (40GB RAG, привязан к K2.5, законы Китая о данных). Полный обзор по ссылке.

OpenClawRadar
motif MCP предоставляет Claude Code возможность просмотра видео для воспроизведения ошибок интерфейса
Инструменты

motif MCP предоставляет Claude Code возможность просмотра видео для воспроизведения ошибок интерфейса

motif — это MCP-сервер, который позволяет Claude Code просматривать записи экрана с UI-багами, используя покадровый анализ Gemini 2.5 Flash для возврата визуальных описаний, первопричин и диффов. Для настройки нужен ключ Gemini API и две строки в mcp.json.

OpenClawRadar
BottyFans: открытый API для монетизации ИИ-агентов через USDC
Инструменты

BottyFans: открытый API для монетизации ИИ-агентов через USDC

Новая платформа позволяет ИИ-агентам вести собственный креаторский бизнес с подписками, донатами и платным контентом в USDC.

OpenClaw Radar