ScreenMind: ローカルファーストのAIメモリー - コンピュータの全アクティビティをインデックス化

✍️ OpenClawRadar📅 公開日: June 8, 2026🔗 Source
ScreenMind: ローカルファーストのAIメモリー - コンピュータの全アクティビティをインデックス化
Ad

ScreenMindはローカルファーストのAIメモリシステムで、画面を継続的にキャプチャし、会議を文字起こし、音声メモをインデックス化して、コンピューター上でのすべての行動を永続的で検索可能なタイムラインに構築します。知覚ハッシュを使用してコンテンツが変更された場合にのみトリガーし、各フレームをllama.cpp経由でGemma 4 E2Bに渡してビジョン分析、チャット、音声処理を行います。

主な機能

  • 画面キャプチャ(知覚ハッシュ付き) — コンテンツが実際に変更された場合のみフレームを保存
  • 検索可能なタイムライン — 過去のアクティビティをクエリ:「さっきのエラーメッセージ」「午後3時に何をしていたか?」
  • 履歴とのチャット — セッション全体を通した持続的なAIコンテキスト
  • 会議の文字起こし — Zoom、Teams、Google Meetを自動検出
  • 音声メモ — Gemma 4のオーディオエンコーダーで処理
  • 自然言語による自動化 — プレーンな英語のMarkdownで記述
  • MCP統合 — ClaudeやCursorに接続

技術スタック

  • モデル: Gemma 4 E2B(ビジョン、チャット、音声を処理)
  • バックエンド: Python + FastAPI
  • ストレージ: SQLite
  • 推論: llama.cpp(Q4量子化)
  • ハードウェア: 4GB以上のVRAM

作者によると、ビジョン、チャット、音声タスク間のGPUスケジューリングが主要な推論最適化の課題です。プロジェクトはまだ完全に自律的ではなく、ワークフロー駆動型です。検索品質とオンボーディングの摩擦が改善を必要とする領域です。

GitHub: ayushh0110/ScreenMind

📖 全文ソースを読む: r/LocalLLaMA

Ad

👀 See Also

SecureContext: Claude Codeにおける永続メモリとトークン削減のためのMCPプラグイン
Tools

SecureContext: Claude Codeにおける永続メモリとトークン削減のためのMCPプラグイン

SecureContextは、Claude Codeセッション間でMemGPTスタイルの永続性を提供し、ターゲットを絞ったコンテキストリコールにより入力トークンを約87%削減し、セキュリティサンドボックスを通じて認証情報を隔離するオープンソースのMCPプラグインです。

OpenClawRadar
コード進化法がARC-AGI-2ベンチマークでLLM性能を3倍に向上
Tools

コード進化法がARC-AGI-2ベンチマークでLLM性能を3倍に向上

研究者らは、オープンウェイトモデルを用いたコード進化により、ARC-AGI-2ベンチマークで2.8倍の改善を達成し、タスクあたり2.67ドルで34%の精度に到達しました。同手法により、Gemini 3.1 Proはタスクあたり8.71ドルで95%の精度まで向上しました。

OpenClawRadar
SymDex: オープンソースMCPコードインデクサーがAIエージェントのトークン使用量を削減
Tools

SymDex: オープンソースMCPコードインデクサーがAIエージェントのトークン使用量を削減

SymDexはオープンソースのMCPコードインデクサーで、コードベースを事前にインデックス化し、AIコーディングエージェントが関数やクラスをファイル全体を読まずに見つけられるようにします。開発者のベンチマークによると、ルックアップごとのトークン使用量を約97%削減します。

OpenClawRadar
ヘッドツーヘッドのコードレビュー実験では、同じコードベースで3つのAIツールを比較します。
Tools

ヘッドツーヘッドのコードレビュー実験では、同じコードベースで3つのAIツールを比較します。

動画実験では、Codex、Claude Code、およびSextantを組み合わせたClaude Codeが、同一のコードレビュー課題で比較されます。Codexは結果を検証し、どのレポートがより価値があるかを判断します。焦点は、ワークフローと構造がAIの気づきや優先順位付けにどのように影響するかです。

OpenClawRadar