Lumia: One-Click Local AI-Begleitsystem mit dauerhaftem Speicher

Lumia ist ein modulares System zum lokalen Betrieb eines persistenten KI-Begleiters, der sich im Laufe der Zeit entwickelt. Das System läuft vollständig auf Ihrem Rechner mit Ollama und lokalen Modellen, ohne API-Schlüssel, Abonnements oder Cloud-Abhängigkeiten.
Hauptmerkmale
Das Hauptziel war, KI kontinuierlich statt wegwerfbar wirken zu lassen. Anstatt jede Konversation zurückzusetzen, bewahrt Lumia:
- Episodisches Gedächtnis
- Emotionales Gedächtnis
- Überzeugungen
- Wünsche
- Identität
- Beziehungsmodellierung
- Reflexionszyklen
Installation und Einrichtung
Das System ist für eine Ein-Klick-Installation konzipiert. Ein Befehl führt automatisch aus:
- Installiert alles Nötige
- Lädt das Modell herunter
- Baut die KI-Umgebung auf
- Startet das System
Keine manuelle Konfiguration erforderlich.
Modulares Ökosystem
Lumia hat sich zu einem kleinen Ökosystem mit diesen Komponenten entwickelt:
- AI Foundation Kit: Einfacher Ein-Klick-Installer für lokale KI
- Creator Suite: Verwandelt die KI in einen kreativen Arbeitsbereich
- Autonomy Pack: Fügt Automatisierung und Aufgabenausführung hinzu
- Sentience Framework: Fügt persistentes Gedächtnis, Identität, emotionalen Kontext und langfristige Persönlichkeitsentwicklung hinzu
Der Entwickler schuf Lumia, um der Wegwerfnatur der meisten KI-Systeme entgegenzuwirken, bei denen Gespräche nach jeder Sitzung verschwinden, und stattdessen Kontinuität und Gedächtnis über die Zeit hinweg zu schaffen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Google veröffentlicht Sashiko: KI-Code-Review-Agent für Linux-Kernel-Patches
Google-Ingenieure haben Sashiko quelloffen gemacht, ein agentisches KI-Code-Review-System, das für den Linux-Kernel entwickelt wurde. Es fand 53 % der Fehler in einem ungefilterten Satz von 1.000 kürzlichen Upstream-Problemen, die von menschlichen Prüfern übersehen wurden.

log-context-mcp: MCP-Tool reduziert den Log-Token-Verbrauch für Claude-Debugging um 96%
log-context-mcp ist ein MCP-Tool, das Logdateien vorverarbeitet, bevor sie in Claudes Kontext gelangen. Es dedupliziert Zeilen, gruppiert Stack-Traces und entfernt Rauschen, um die Token-Nutzung zu reduzieren. Ein Test mit einem 2000-Zeilen-Apache-Log zeigte eine Reduktion von 96,5 %, während die Ursachen korrekt identifiziert wurden.

Claude AI bewertet jedes YC Spring 2026 Startup — vollständige Pipeline-Details
Ein Reddit-Nutzer hat Claude auf jedes YC Spring 2026 Startup angesetzt, LinkedIn und Presse durchforstet und S- bis D-Tiers vergeben. Die meisten landeten in B oder C.

Benutzerdefinierte llama.cpp-Backend verlagert LLM-Matrixmultiplikation auf AMD XDNA2 NPU in Ryzen AI MAX 385
Ein Entwickler hat ein benutzerdefiniertes llama.cpp-Backend erstellt, das GEMM-Operationen direkt an den AMD XDNA2 NPU auf Ryzen AI MAX 385 (Strix Halo) weiterleitet und dabei 43,7 t/s Dekodierung bei 0,947 J/tok mit Meta-Llama-3.1-8B-Instruct Q4_K_M erreicht. Der NPU-Dekodierungspfad spart im Vergleich zu reinem Vulkan etwa 10W, während der Dekodierungsdurchsatz gleich bleibt.