OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats

✍️ OpenClawRadar📅 Veröffentlicht: 16. März 2026🔗 Source
OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats
Ad

Was OmniRecall macht

OmniRecall ist eine lokale mitmproxy-Umgehung, die den Datenverkehr zu Cloud-Chat-Schnittstellen abfängt (getestet mit DeepSeek). Es hackt sich in den proprietären SSE-Fragmentstrom und zwingt dem System, das für zustandslosen Betrieb konzipiert wurde, eine Langzeitspeicherschicht auf.

Technischer Mechanismus

  • Deep-Packet-Parsing: Rekonstruiert die vollständige Assistenten-Antwort durch Verfolgung von Echtzeit-Patches
  • Befehlssteuerung: Erkennt [ADD], [UPDATE], [REMOVE], [CLEAR] aus der KI-Ausgabe
  • Lokales Gehirn: Verwaltet memory.txt + FAISS-Index (sentence-transformers MiniLM-L6)
  • Kontextinjektion: Die am besten erinnerten Fakten werden als [RECALL: ...] in Ihre nächste Nachricht eingefügt

Aktueller Status & Einschränkungen

Dies ist eine Beta-/Experimentalfreigabe. Der Entwickler merkt an: "Das ist das Nächste, was ich nach Wochen Debugging-Hölle dem Traum kommen konnte. Es ist fehlerhaft. Es ist experimentell. [ADD] ist größtenteils stabil, aber [SEARCH] ist launisch – wenn Sie Perfektion wollen, reparieren Sie es selbst. Ich habe meine Energiegrenze für diesen Build erreicht."

Upstream-UI-Änderungen werden es brechen. Der Entwickler erklärt: "Wenn es kaputtgeht, ist das jetzt Ihr Problem."

Ad

Anforderungen & Einrichtung

Potato-PC-Anforderungen:

  • Nur CPU (faiss-cpu + all-MiniLM-L6-v2)
  • Kein lokales LLM erforderlich – erweitert die Cloud-Modelle, die Sie bereits nutzen
  • Null Kosten, keine API-Schlüssel, 100 % lokale Datenisolierung

Bereitstellung:

pip install mitmproxy faiss-cpu sentence-transformers numpy

Vertrauen Sie dem mitmproxy-CA-Zertifikat auf Ihrem OS/Browser (führen Sie mitmproxy einmal aus, um es zu generieren). Setzen Sie den System-Proxy auf 127.0.0.1:8080. Dann ausführen:

mitmdump -s omnirecall.py

Gehen Sie zu chat.deepseek.com und beginnen Sie, ihm Erinnerungen zu füttern.

Lizenzbedingungen

Das Projekt verwendet eine aggressiv restriktive quelloffene Lizenz:

  • Keine kommerzielle Nutzung
  • Keine privaten Forks
  • Verpflichtende öffentliche ALTERATIONS.md für jegliche Logikänderungen
  • Wenn Sie zu Claude/GPT-4o/irgendwas portieren, halten Sie es gemäß der Lizenz öffentlich

Der Entwickler erklärt: "Ich habe zu viele Solo-Entwicklerprojekte gesehen, die ausgeschlachtet, privatisiert oder in kostenpflichtige SaaS verwandelt wurden, während der Ersteller leer ausgeht. Diese Lizenz ist nicht freundlich – sie ist dazu gebaut, die Arbeit genau vor solchen Leuten zu schützen. Wenn die Bedingungen Sie abschrecken, das ist der Sinn."

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM
Werkzeuge

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM

ToolLoop ist ein Open-Source-Python-Framework mit 11 Tools für Dateioperationen, Codesuche, Shell-Zugriff und Sub-Agenten, das über LiteLLM mit jedem LLM funktioniert. Das 2.700-Zeilen-Framework ermöglicht den Wechsel von Modellen während einer Konversation bei gleichbleibendem gemeinsamen Kontext.

OpenClawRadar
Gratis macOS Menüleisten-App zeigt Echtzeit-Claude-Nutzungsstatistiken via SQLite-Cookie-Entschlüsselung
Werkzeuge

Gratis macOS Menüleisten-App zeigt Echtzeit-Claude-Nutzungsstatistiken via SQLite-Cookie-Entschlüsselung

Claude Usage Tracker ist eine kostenlose macOS-Menüleisten-App, die die verschlüsselten SQLite-Cookies der Claude-Desktop-App ausliest, sie via Keychain entschlüsselt und Sitzungsprozente, wöchentliches Limit, Ausgaben und Routineläufe lokal anzeigt – kein API-Key erforderlich.

OpenClawRadar
ModelFitAI: KI-Agenten ohne VPS-Einrichtung bereitstellen, erstellt mit Claude Code
Werkzeuge

ModelFitAI: KI-Agenten ohne VPS-Einrichtung bereitstellen, erstellt mit Claude Code

ModelFitAI ist eine Plattform, die es Entwicklern ermöglicht, KI-Agenten direkt auf ihrer Infrastruktur zu deployen, ohne VPS-Einrichtung, Docker-Konfiguration und SSH-Sitzungen. Die gesamte Plattform wurde von einem Einzelgründer mit Claude Code erstellt.

OpenClawRadar
AgentRoom: Desktop-App visualisiert KI-Codierungsagenten als Pixelcharaktere mit Sitzungssuche
Werkzeuge

AgentRoom: Desktop-App visualisiert KI-Codierungsagenten als Pixelcharaktere mit Sitzungssuche

AgentRoom ist eine Desktop-App, die Claude Code-, Codex- und Gemini-Sitzungen in animierte Pixel-Charaktere in einem virtuellen Büro verwandelt, mit Volltext-Semantiksuche über alle Sitzungen. Das Repo enthält eine eigenständige Claude Code-Skill zum Durchsuchen vergangener Sitzungen aus jeder Konversation.

OpenClawRadar