OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats

✍️ OpenClawRadar📅 Veröffentlicht: 16. März 2026🔗 Source
OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats
Ad

Was OmniRecall macht

OmniRecall ist eine lokale mitmproxy-Umgehung, die den Datenverkehr zu Cloud-Chat-Schnittstellen abfängt (getestet mit DeepSeek). Es hackt sich in den proprietären SSE-Fragmentstrom und zwingt dem System, das für zustandslosen Betrieb konzipiert wurde, eine Langzeitspeicherschicht auf.

Technischer Mechanismus

  • Deep-Packet-Parsing: Rekonstruiert die vollständige Assistenten-Antwort durch Verfolgung von Echtzeit-Patches
  • Befehlssteuerung: Erkennt [ADD], [UPDATE], [REMOVE], [CLEAR] aus der KI-Ausgabe
  • Lokales Gehirn: Verwaltet memory.txt + FAISS-Index (sentence-transformers MiniLM-L6)
  • Kontextinjektion: Die am besten erinnerten Fakten werden als [RECALL: ...] in Ihre nächste Nachricht eingefügt

Aktueller Status & Einschränkungen

Dies ist eine Beta-/Experimentalfreigabe. Der Entwickler merkt an: "Das ist das Nächste, was ich nach Wochen Debugging-Hölle dem Traum kommen konnte. Es ist fehlerhaft. Es ist experimentell. [ADD] ist größtenteils stabil, aber [SEARCH] ist launisch – wenn Sie Perfektion wollen, reparieren Sie es selbst. Ich habe meine Energiegrenze für diesen Build erreicht."

Upstream-UI-Änderungen werden es brechen. Der Entwickler erklärt: "Wenn es kaputtgeht, ist das jetzt Ihr Problem."

Ad

Anforderungen & Einrichtung

Potato-PC-Anforderungen:

  • Nur CPU (faiss-cpu + all-MiniLM-L6-v2)
  • Kein lokales LLM erforderlich – erweitert die Cloud-Modelle, die Sie bereits nutzen
  • Null Kosten, keine API-Schlüssel, 100 % lokale Datenisolierung

Bereitstellung:

pip install mitmproxy faiss-cpu sentence-transformers numpy

Vertrauen Sie dem mitmproxy-CA-Zertifikat auf Ihrem OS/Browser (führen Sie mitmproxy einmal aus, um es zu generieren). Setzen Sie den System-Proxy auf 127.0.0.1:8080. Dann ausführen:

mitmdump -s omnirecall.py

Gehen Sie zu chat.deepseek.com und beginnen Sie, ihm Erinnerungen zu füttern.

Lizenzbedingungen

Das Projekt verwendet eine aggressiv restriktive quelloffene Lizenz:

  • Keine kommerzielle Nutzung
  • Keine privaten Forks
  • Verpflichtende öffentliche ALTERATIONS.md für jegliche Logikänderungen
  • Wenn Sie zu Claude/GPT-4o/irgendwas portieren, halten Sie es gemäß der Lizenz öffentlich

Der Entwickler erklärt: "Ich habe zu viele Solo-Entwicklerprojekte gesehen, die ausgeschlachtet, privatisiert oder in kostenpflichtige SaaS verwandelt wurden, während der Ersteller leer ausgeht. Diese Lizenz ist nicht freundlich – sie ist dazu gebaut, die Arbeit genau vor solchen Leuten zu schützen. Wenn die Bedingungen Sie abschrecken, das ist der Sinn."

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

RelayPlane Open Source Proxy zeigt 73 % Kostensenkung durch Claude-Modell-Routing
Werkzeuge

RelayPlane Open Source Proxy zeigt 73 % Kostensenkung durch Claude-Modell-Routing

RelayPlane, ein Open-Source-npm-nativer Proxy für die Anthropic API, zeigte in Benchmarks 73,4 % Kosteneinsparungen, indem Anfragen basierend auf der Komplexität an geeignete Claude-Modelle weitergeleitet wurden. Das Tool reduzierte die Kosten pro 10 Anfragen von 0,0323 $ auf 0,0086 $ und verbesserte gleichzeitig die p50-Latenz von 1,55 s auf 0,78 s.

OpenClawRadar
AnyClaw: Ubuntu 24.04 mit Android-Hardware-Zugriff und KI-Agent für die Terminalentwicklung
Werkzeuge

AnyClaw: Ubuntu 24.04 mit Android-Hardware-Zugriff und KI-Agent für die Terminalentwicklung

AnyClaw bietet eine vollständige Ubuntu 24.04-Umgebung, die in proot auf Android läuft, mit direktem Zugriff auf Android-Hardware-APIs über das Terminal, einschließlich Kamera, GPS, Akku und Sensoren über Bash-Befehle und Java-Ausführung. Es enthält einen KI-Coding-Agenten, der diese Werkzeuge orchestrieren kann, und eine Web-UI, die von jedem Browser im selben Netzwerk aus zugänglich ist.

OpenClawRadar
Claude Design Artifacts mit Teenyapp auf Live-Websites bereitstellen
Werkzeuge

Claude Design Artifacts mit Teenyapp auf Live-Websites bereitstellen

Teenyapp bietet einen Hosting-Dienst, den Claude Design direkt über einen Agent-Token-Link aus dem Chat nutzen kann, was eine autonome Bereitstellung von Artifakten mit Backend-Unterstützung ermöglicht.

OpenClawRadar
HTML-Artefakte ersetzen Google Docs für technische Dokumentation, aber es fehlt die Kommentarfunktion
Werkzeuge

HTML-Artefakte ersetzen Google Docs für technische Dokumentation, aber es fehlt die Kommentarfunktion

Claude-generierte HTML-Artefakte ersetzen Google Docs für lange, technische Inhalte wie Spike-Auswertungen und Architekturnoten, aber die Sandbox-iframe-Natur verhindert Inline-Kommentare und Überprüfungsfunktionen.

OpenClawRadar