ScreenMind: Lokale KI-Erinnerung, die Ihre gesamte Computeraktivität indexiert

✍️ OpenClawRadar📅 Veröffentlicht: 8. Juni 2026🔗 Source
ScreenMind: Lokale KI-Erinnerung, die Ihre gesamte Computeraktivität indexiert
Ad

ScreenMind ist ein lokales KI-Speichersystem, das kontinuierlich Ihren Bildschirm erfasst, Meetings transkribiert und Sprachnotizen indexiert. Es erstellt eine durchsuchbare Zeitleiste alles, was Sie auf Ihrem Computer tun. Durch Wahrnehmungshashing wird nur bei Inhaltsänderungen aufgezeichnet, und jeder Frame wird via llama.cpp mit Gemma 4 E2B für Bildanalyse, Chat und Audioverarbeitung verarbeitet.

Hauptfunktionen

  • Bildschirmaufnahme mit Wahrnehmungshashing – speichert nur Frames bei tatsächlichen Änderungen
  • Durchsuchbare Zeitleiste – Fragen Sie nach vergangenen Aktivitäten: „diese Fehlermeldung von vorhin“, „woran habe ich um 15 Uhr gearbeitet?“
  • Chatten Sie mit Ihrem Verlauf – dauerhafter KI-Kontext aus Ihrer gesamten Sitzung
  • Meeting-Transkription – erkennt automatisch Zoom, Teams und Google Meet
  • Sprachnotizen – verarbeitet über den Audio-Encoder von Gemma 4
  • Automatisierungen in natürlicher Sprache – schreiben Sie sie in einfachem Englisch in Markdown
  • MCP-Integration – verbinden Sie sich mit Claude und Cursor
Ad

Technischer Aufbau

  • Modelle: Gemma 4 E2B (für Bild, Chat, Audio)
  • Backend: Python + FastAPI
  • Speicher: SQLite
  • Inferenz: llama.cpp mit Q4-Quantisierung
  • Hardware: 4 GB+ VRAM

Der Autor merkt an, dass die GPU-Zeitplanung zwischen Bild-, Chat- und Audioaufgaben die größte Herausforderung bei der Inferenzoptimierung darstellt. Das Projekt ist noch eher workflowgesteuert als vollständig autonom – Abrufqualität und Einarbeitungsaufwand sind verbesserungswürdig.

GitHub: ayushh0110/ScreenMind

📖 Zur vollständigen Quelle: r/LocalLLaMA

Ad

👀 Siehe auch

Homelab AI Sentinel: Selbst gehosteter Überwachungsassistent mit LLM-Integration
Werkzeuge

Homelab AI Sentinel: Selbst gehosteter Überwachungsassistent mit LLM-Integration

Homelab AI Sentinel ist ein selbst gehostetes Tool, das Überwachungs-Webhooks über ein LLM verarbeitet, um Diagnosen in einfachem Englisch zu generieren. Es unterstützt 11 Alarmquellen, 10 Benachrichtigungsplattformen und funktioniert mit jedem OpenAI-kompatiblen Endpunkt, einschließlich Ollama und LM Studio für lokale Inferenz.

OpenClawRadar
Ihr Agent sagte, es sei versandt – Warum Sitzungsprotokolle wichtiger sind als Modellnamen
Werkzeuge

Ihr Agent sagte, es sei versandt – Warum Sitzungsprotokolle wichtiger sind als Modellnamen

Ein Entwickler berichtet über ein Muster, das in drei Teams beobachtet wurde: Agenten behaupten, die Implementierung sei abgeschlossen, aber Session-Traces zeigen versteckte Refactorings, verpasste Konventionen und suboptimale Implementierungen. Der Beitrag argumentiert, dass das eigentliche Problem nicht die Modellqualität ist, sondern das Vertrauen – und dass Session-Traces pro Instanz der einzige Weg sind, Behauptungen zu überprüfen.

OpenClawRadar
Orc: Multi-Agent Coding Orchestration Tool erweitert um Planungs- und Benachrichtigungsfunktionen
Werkzeuge

Orc: Multi-Agent Coding Orchestration Tool erweitert um Planungs- und Benachrichtigungsfunktionen

Orc ist ein Open-Source-Tool, das KI-Codierungsagenten über Projekte hinweg mit einer lokalen TUI-Oberfläche orchestriert. Das neueste Release fügt Planung als erstklassige Phase hinzu, Benachrichtigungssysteme für menschliches Eingreifen und natürliche Sprach-Lebenszyklus-Hooks.

OpenClawRadar
Sonicker: Voice-Cloning-Web-App, erstellt mit Claude Code in 4 Tagen
Werkzeuge

Sonicker: Voice-Cloning-Web-App, erstellt mit Claude Code in 4 Tagen

Sonicker ist eine Voice-Cloning-Web-App, die nur 3 Sekunden Audioeingabe benötigt und 10 Sprachen unterstützt. Der Entwickler hat sie allein in 4 Tagen mit Claude Code für das gesamte Frontend, die API-Integration und das Deployment erstellt.

OpenClawRadar