OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats

Was OmniRecall macht
OmniRecall ist eine lokale mitmproxy-Umgehung, die den Datenverkehr zu Cloud-Chat-Schnittstellen abfängt (getestet mit DeepSeek). Es hackt sich in den proprietären SSE-Fragmentstrom und zwingt dem System, das für zustandslosen Betrieb konzipiert wurde, eine Langzeitspeicherschicht auf.
Technischer Mechanismus
- Deep-Packet-Parsing: Rekonstruiert die vollständige Assistenten-Antwort durch Verfolgung von Echtzeit-Patches
- Befehlssteuerung: Erkennt [ADD], [UPDATE], [REMOVE], [CLEAR] aus der KI-Ausgabe
- Lokales Gehirn: Verwaltet memory.txt + FAISS-Index (sentence-transformers MiniLM-L6)
- Kontextinjektion: Die am besten erinnerten Fakten werden als [RECALL: ...] in Ihre nächste Nachricht eingefügt
Aktueller Status & Einschränkungen
Dies ist eine Beta-/Experimentalfreigabe. Der Entwickler merkt an: "Das ist das Nächste, was ich nach Wochen Debugging-Hölle dem Traum kommen konnte. Es ist fehlerhaft. Es ist experimentell. [ADD] ist größtenteils stabil, aber [SEARCH] ist launisch – wenn Sie Perfektion wollen, reparieren Sie es selbst. Ich habe meine Energiegrenze für diesen Build erreicht."
Upstream-UI-Änderungen werden es brechen. Der Entwickler erklärt: "Wenn es kaputtgeht, ist das jetzt Ihr Problem."
Anforderungen & Einrichtung
Potato-PC-Anforderungen:
- Nur CPU (faiss-cpu + all-MiniLM-L6-v2)
- Kein lokales LLM erforderlich – erweitert die Cloud-Modelle, die Sie bereits nutzen
- Null Kosten, keine API-Schlüssel, 100 % lokale Datenisolierung
Bereitstellung:
pip install mitmproxy faiss-cpu sentence-transformers numpyVertrauen Sie dem mitmproxy-CA-Zertifikat auf Ihrem OS/Browser (führen Sie mitmproxy einmal aus, um es zu generieren). Setzen Sie den System-Proxy auf 127.0.0.1:8080. Dann ausführen:
mitmdump -s omnirecall.pyGehen Sie zu chat.deepseek.com und beginnen Sie, ihm Erinnerungen zu füttern.
Lizenzbedingungen
Das Projekt verwendet eine aggressiv restriktive quelloffene Lizenz:
- Keine kommerzielle Nutzung
- Keine privaten Forks
- Verpflichtende öffentliche ALTERATIONS.md für jegliche Logikänderungen
- Wenn Sie zu Claude/GPT-4o/irgendwas portieren, halten Sie es gemäß der Lizenz öffentlich
Der Entwickler erklärt: "Ich habe zu viele Solo-Entwicklerprojekte gesehen, die ausgeschlachtet, privatisiert oder in kostenpflichtige SaaS verwandelt wurden, während der Ersteller leer ausgeht. Diese Lizenz ist nicht freundlich – sie ist dazu gebaut, die Arbeit genau vor solchen Leuten zu schützen. Wenn die Bedingungen Sie abschrecken, das ist der Sinn."
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM
ToolLoop ist ein Open-Source-Python-Framework mit 11 Tools für Dateioperationen, Codesuche, Shell-Zugriff und Sub-Agenten, das über LiteLLM mit jedem LLM funktioniert. Das 2.700-Zeilen-Framework ermöglicht den Wechsel von Modellen während einer Konversation bei gleichbleibendem gemeinsamen Kontext.

Gratis macOS Menüleisten-App zeigt Echtzeit-Claude-Nutzungsstatistiken via SQLite-Cookie-Entschlüsselung
Claude Usage Tracker ist eine kostenlose macOS-Menüleisten-App, die die verschlüsselten SQLite-Cookies der Claude-Desktop-App ausliest, sie via Keychain entschlüsselt und Sitzungsprozente, wöchentliches Limit, Ausgaben und Routineläufe lokal anzeigt – kein API-Key erforderlich.

ModelFitAI: KI-Agenten ohne VPS-Einrichtung bereitstellen, erstellt mit Claude Code
ModelFitAI ist eine Plattform, die es Entwicklern ermöglicht, KI-Agenten direkt auf ihrer Infrastruktur zu deployen, ohne VPS-Einrichtung, Docker-Konfiguration und SSH-Sitzungen. Die gesamte Plattform wurde von einem Einzelgründer mit Claude Code erstellt.

AgentRoom: Desktop-App visualisiert KI-Codierungsagenten als Pixelcharaktere mit Sitzungssuche
AgentRoom ist eine Desktop-App, die Claude Code-, Codex- und Gemini-Sitzungen in animierte Pixel-Charaktere in einem virtuellen Büro verwandelt, mit Volltext-Semantiksuche über alle Sitzungen. Das Repo enthält eine eigenständige Claude Code-Skill zum Durchsuchen vergangener Sitzungen aus jeder Konversation.