OmniRecall Beta: FAISS-gestützte Speicherinjektion für Cloud-LLM-Chats

Was OmniRecall macht
OmniRecall ist eine lokale mitmproxy-Umgehung, die den Datenverkehr zu Cloud-Chat-Schnittstellen abfängt (getestet mit DeepSeek). Es hackt sich in den proprietären SSE-Fragmentstrom und zwingt dem System, das für zustandslosen Betrieb konzipiert wurde, eine Langzeitspeicherschicht auf.
Technischer Mechanismus
- Deep-Packet-Parsing: Rekonstruiert die vollständige Assistenten-Antwort durch Verfolgung von Echtzeit-Patches
- Befehlssteuerung: Erkennt [ADD], [UPDATE], [REMOVE], [CLEAR] aus der KI-Ausgabe
- Lokales Gehirn: Verwaltet memory.txt + FAISS-Index (sentence-transformers MiniLM-L6)
- Kontextinjektion: Die am besten erinnerten Fakten werden als [RECALL: ...] in Ihre nächste Nachricht eingefügt
Aktueller Status & Einschränkungen
Dies ist eine Beta-/Experimentalfreigabe. Der Entwickler merkt an: "Das ist das Nächste, was ich nach Wochen Debugging-Hölle dem Traum kommen konnte. Es ist fehlerhaft. Es ist experimentell. [ADD] ist größtenteils stabil, aber [SEARCH] ist launisch – wenn Sie Perfektion wollen, reparieren Sie es selbst. Ich habe meine Energiegrenze für diesen Build erreicht."
Upstream-UI-Änderungen werden es brechen. Der Entwickler erklärt: "Wenn es kaputtgeht, ist das jetzt Ihr Problem."
Anforderungen & Einrichtung
Potato-PC-Anforderungen:
- Nur CPU (faiss-cpu + all-MiniLM-L6-v2)
- Kein lokales LLM erforderlich – erweitert die Cloud-Modelle, die Sie bereits nutzen
- Null Kosten, keine API-Schlüssel, 100 % lokale Datenisolierung
Bereitstellung:
pip install mitmproxy faiss-cpu sentence-transformers numpyVertrauen Sie dem mitmproxy-CA-Zertifikat auf Ihrem OS/Browser (führen Sie mitmproxy einmal aus, um es zu generieren). Setzen Sie den System-Proxy auf 127.0.0.1:8080. Dann ausführen:
mitmdump -s omnirecall.pyGehen Sie zu chat.deepseek.com und beginnen Sie, ihm Erinnerungen zu füttern.
Lizenzbedingungen
Das Projekt verwendet eine aggressiv restriktive quelloffene Lizenz:
- Keine kommerzielle Nutzung
- Keine privaten Forks
- Verpflichtende öffentliche ALTERATIONS.md für jegliche Logikänderungen
- Wenn Sie zu Claude/GPT-4o/irgendwas portieren, halten Sie es gemäß der Lizenz öffentlich
Der Entwickler erklärt: "Ich habe zu viele Solo-Entwicklerprojekte gesehen, die ausgeschlachtet, privatisiert oder in kostenpflichtige SaaS verwandelt wurden, während der Ersteller leer ausgeht. Diese Lizenz ist nicht freundlich – sie ist dazu gebaut, die Arbeit genau vor solchen Leuten zu schützen. Wenn die Bedingungen Sie abschrecken, das ist der Sinn."
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

RelayPlane Open Source Proxy zeigt 73 % Kostensenkung durch Claude-Modell-Routing
RelayPlane, ein Open-Source-npm-nativer Proxy für die Anthropic API, zeigte in Benchmarks 73,4 % Kosteneinsparungen, indem Anfragen basierend auf der Komplexität an geeignete Claude-Modelle weitergeleitet wurden. Das Tool reduzierte die Kosten pro 10 Anfragen von 0,0323 $ auf 0,0086 $ und verbesserte gleichzeitig die p50-Latenz von 1,55 s auf 0,78 s.

AnyClaw: Ubuntu 24.04 mit Android-Hardware-Zugriff und KI-Agent für die Terminalentwicklung
AnyClaw bietet eine vollständige Ubuntu 24.04-Umgebung, die in proot auf Android läuft, mit direktem Zugriff auf Android-Hardware-APIs über das Terminal, einschließlich Kamera, GPS, Akku und Sensoren über Bash-Befehle und Java-Ausführung. Es enthält einen KI-Coding-Agenten, der diese Werkzeuge orchestrieren kann, und eine Web-UI, die von jedem Browser im selben Netzwerk aus zugänglich ist.

Claude Design Artifacts mit Teenyapp auf Live-Websites bereitstellen
Teenyapp bietet einen Hosting-Dienst, den Claude Design direkt über einen Agent-Token-Link aus dem Chat nutzen kann, was eine autonome Bereitstellung von Artifakten mit Backend-Unterstützung ermöglicht.

HTML-Artefakte ersetzen Google Docs für technische Dokumentation, aber es fehlt die Kommentarfunktion
Claude-generierte HTML-Artefakte ersetzen Google Docs für lange, technische Inhalte wie Spike-Auswertungen und Architekturnoten, aber die Sandbox-iframe-Natur verhindert Inline-Kommentare und Überprüfungsfunktionen.