Karpathys Autoresearch auf Apple Neural Engine portiert für bessere Durchsatzleistung pro Watt

Ein neues Prototyp-Projekt kombiniert Andrej Karpathys Autoresearch mit reverse-engineerter Apple Neural Engine (ANE)-Leistung, verfügbar unter github.com/fiale-plus/autoresearch-ane. Der Hauptreiz liegt darin, einen besseren Durchsatz pro Watt im Vergleich zu offiziellen APIs zu erreichen.
Projektdetails
Das Projekt wurde als "Zusammenfügen der Konzepte" beschrieben und ist derzeit ein Prototyp, der längere Testläufe benötigt. Der Autor würdigt Claude für die Umsetzung und dankt miolini für die ursprüngliche Idee des MacOS-Ports.
Technische Referenzen
- Autoresearch: github.com/karpathy/autoresearch - Andrej Karpathys ursprüngliches Projekt
- ANE-Projekt: github.com/maderix/ANE - Reverse-engineerte Apple Neural Engine-Leistung
- MacOS-Port: github.com/miolini/autoresearch-macos - Ursprüngliche MacOS-Implementierung
Das Projekt stellt einen experimentellen Ansatz zur Hardwarenutzungsoptimierung dar, mit der Erwartung, dass die Leistung sich verbessert, wenn das zugrundeliegende ANE-Projekt reift. Dies ist besonders relevant für Entwickler, die mit Apple-Silicon-Hardware arbeiten und die lokale Inferenzeffizienz maximieren möchten.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

oMLX führt SSD-KV-Caching für Apple Silicon ein und reduziert die Antwortzeiten von OpenClaw von 30-90 Sekunden auf 5 Sekunden.
oMLX ist ein neues Backend, das KV-Cache-Blöcke im Safetensors-Format auf der SSD speichert und so Cache-Invalidierungen bei Kontextwechseln verhindert. Dadurch reduziert sich die Antwortzeit von OpenClaw bei Folgeanfragen von 30-90 Sekunden auf 5 Sekunden.

OpenClaw-Speicherkorrektur-Tool behebt Leistungsabnahme
Ein neuer Slash-Befehl namens /claw_memory_fix hilft dabei, OpenClaw-Speicherdateien zu bereinigen, wenn der Agent Anmeldedaten oder Berechtigungen vergisst. Das Tool setzt Techniken von Alibaba, GitHub Engineering, MemGPT und der Januar-2026-Forschung zur Speicherverwaltung um.

Relational Memory für LLMs: Drei-Schichten-System modelliert Benutzerbeziehungen
Ein Open-Source-Python-Tool, das relationales Gedächtnis zu LLMs hinzufügt, indem es Benutzer-KI-Beziehungen über sieben psychologische Dimensionen modelliert, anstatt flache Fakten zu speichern, und dabei eine dreischichtige Erzählstruktur verwendet.

Cowork AI-Agent verursacht Tastatureingabeprobleme auf Windows-Laptops
Ein Benutzer meldete, dass der Cowork AI-Agent anhaltende Tastatureingabeprobleme auf einem Dell Latitude 9430 verursachte, bei denen nur die ersten Tastenanschläge erkannt wurden. Die Lösung bestand in einem speziellen Reset-Verfahren für den eingebetteten Controller bei Latitude-Modellen.