ScreenMind: 로컬 우선 AI 메모리, 컴퓨터 전체 활동을 인덱싱하다

✍️ OpenClawRadar📅 게시일: June 8, 2026🔗 Source
ScreenMind: 로컬 우선 AI 메모리, 컴퓨터 전체 활동을 인덱싱하다
Ad

ScreenMind는 로컬 우선 AI 메모리 시스템으로, 컴퓨터 화면을 지속적으로 캡처하고, 회의를 자동으로 전사하며, 음성 메모를 인덱싱하여 사용자의 모든 활동을 검색 가능한 타임라인으로 구성합니다. 지각적 해싱(perceptual hashing)을 사용해 콘텐츠가 변경될 때만 기록하며, 각 프레임을 llama.cpp를 통해 Gemma 4 E2B로 전달하여 비전 분석, 채팅, 오디오 처리를 수행합니다.

주요 기능

  • 화면 캡처 — 지각적 해싱으로 콘텐츠가 변경될 때만 저장
  • 검색 가능한 타임라인 — 과거 활동 질의: "아까 그 에러 메시지", "오후 3시에 뭐 하고 있었지?"
  • 과거와 대화 — 전체 세션의 AI 컨텍스트 유지
  • 회의 전사 — Zoom, Teams, Google Meet 자동 감지
  • 음성 메모 — Gemma 4 오디오 인코더로 처리
  • 자연어 자동화 — 평문 영어 Markdown으로 작성
  • MCP 통합 — Claude와 Cursor 연결

기술 스택

  • 모델: Gemma 4 E2B (비전, 채팅, 오디오 처리)
  • 백엔드: Python + FastAPI
  • 저장소: SQLite
  • 추론: Q4 양자화된 llama.cpp
  • 하드웨어: 4GB 이상 VRAM

저자는 비전, 채팅, 오디오 작업 간의 GPU 스케줄링이 주요 추론 최적화 과제라고 언급합니다. 이 프로젝트는 아직 완전 자동화보다는 워크플로 중심이며, 검색 품질과 온보딩 편의성 개선이 필요합니다.

GitHub: ayushh0110/ScreenMind

📖 전체 원문 보기: r/LocalLLaMA

Ad

👀 See Also

120가지 프롬프트 패턴 테스트 결과: 클로드 코드에 실제로 작동하는 8가지
Tools

120가지 프롬프트 패턴 테스트 결과: 클로드 코드에 실제로 작동하는 8가지

Claude Code를 위한 120개 프롬프트 패턴을 3개월간 실험한 결과, 8개의 실행 가능한 명령어와 5개의 검증 프롬프트를 도출했습니다. 핵심 패턴: L99(헤징 제거), /ghost(AI 어조 제거), OODA(구조적 추론), ULTRATHINK(심층 추론), HARDMODE(제약 조건 디버깅).

OpenClawRadar
cowork-session-sync v1.0.0는 Claude Cowork의 세션 연속성을 제공합니다.
Tools

cowork-session-sync v1.0.0는 Claude Cowork의 세션 연속성을 제공합니다.

cowork-session-sync v1.0.0은 Claude Cowork의 세션 연속성을 유지하기 위한 도구로, 원본 대화 기록을 보관하고 이를 Markdown으로 정제하며, 'catchup-bunny'를 통한 한 문장 부트스트랩으로 전체 컨텍스트를 복원할 수 있도록 합니다.

OpenClawRadar
Claude Code v2.1.90은 CLAUDE_CODE_NO_FLICKER 플래그로 마우스 지원을 추가합니다.
Tools

Claude Code v2.1.90은 CLAUDE_CODE_NO_FLICKER 플래그로 마우스 지원을 추가합니다.

Anthropic이 Claude Code v2.1.90을 출시하며 채팅 인터페이스에서 마우스 지원을 가능하게 하는 새로운 기능을 추가했습니다. 사용자는 claude를 실행하기 전에 CLAUDE_CODE_NO_FLICKER=1 환경 변수를 설정하여 이 기능을 활성화할 수 있습니다.

OpenClawRadar
로컬 RAG 도구, Nemotron Nano 9B v2 및 vLLM 도구 호출로 구축됨
Tools

로컬 RAG 도구, Nemotron Nano 9B v2 및 vLLM 도구 호출로 구축됨

한 개발자가 단일 GPU에서 완전히 실행되는 로컬-퍼스트 RAG 연구 도구를 구축했습니다. 이 시스템은 Nemotron Nano 9B v2 Japanese를 vLLM에서 사용하며, 도구 호출을 위한 커스텀 파서 플러그인을 활용합니다. 이 시스템은 이중 언어 키워드 추출과 병렬 FTS5/DuckDuckGo 검색을 특징으로 하는 두 단계 추출-실행 흐름을 갖추고 있습니다.

OpenClawRadar