55 ANE-Experimente per Telefon: Kernel-Fusion senkt Verlust & Latenz

Ein Entwickler führte 55 Optimierungsexperimente auf dem autoresearch-ane-Fork durch und steuerte den Prozess hauptsächlich von seinem Telefon aus an einem Samstag. Die Arbeit konzentrierte sich auf Leistungsverbesserungen der Apple Neural Engine (ANE) durch Kerneloptimierung und architektonische Änderungen.

Leistungsverbesserungen

Die Experimente erzielten messbare Verbesserungen in mehreren Metriken:

Der Validierungsverlust sank von 3,75 (ein Rückfall von optimierten 3,2) auf 2,49
Die Schrittzeit verbesserte sich von 176 ms auf 96 ms
Die ANE-Auslastung stieg von 3,6 % auf 6,5 %

Wichtige technische Änderung

Die bedeutendste Verbesserung kam durch Kernel-Fusion: "Die Verschmelzung von 3 ANE-Kerneln zu einem Mega-Kernel eliminierte 12 IOSurface-Rundläufe pro Schritt – diese einzelne Änderung übertraf alle Hyperparameter-Anpassungen zusammen." Diese architektonische Optimierung erwies sich als wirkungsvoller als Parameteranpassungen.

Arbeitsablaufdetails

Der Entwickler verwendete einen unkonventionellen Ansatz:

Führte Experimente remote durch, gesteuert von seinem Telefon in kurzen Momenten
Nutzte Claude für Brainstorming und zum Ziehen von Erkenntnissen aus öffentlichen Quellen, die im Repository-README aufgeführt sind
Näherte sich dem Problem mit "kurzer Aufmerksamkeit und minimaler Token-Eingabe" – spekulierte über Richtungen, anstatt präzise Schritte vorzugeben
Absolvierte 55 Experimente mit "mehreren Fällen von tatsächlichem Tippen"
Arbeitete ausschließlich im nicht-destruktiven Modus aufgrund von Berechtigungseinschränkungen ("kein rm -rf /* und ähnliches")

Hauptlernerfolg

Über die technischen Verbesserungen hinaus bemerkte der Entwickler: "Die Hauptlehre ist nicht die Verbesserung selbst. Es ist, dass kurze Aufmerksamkeit und minimale Token-Eingabe – Brainstorming von Richtungen, nicht das Vorgeben von Schritten – echte messbare Gewinne bei einem schwierigen Systemproblem erzielen können."

Die Arbeit wurde auf dem Laptop des Entwicklers durchgeführt, und er erwähnt eine Diskrepanz in der Akzeptanzrate: "55vs45 passt nicht ganz" in Bezug auf die Experimentergebnisse.

📖 Read the full source: r/LocalLLaMA

Die Optimierung von ANE durch telefonisch gesteuerte KI-Experimente zeigt Vorteile der Kernel-Fusion.

Leistungsverbesserungen

Wichtige technische Änderung

Arbeitsablaufdetails

Hauptlernerfolg

👀 Siehe auch

Caddie: Slack-basierte Alternative zu OpenClaw startet nächste Woche

mentioned.to vs. breitere Überwachungstools: Ein Workflow-Vergleich mit Fokus auf Reddit

apple-music-play OpenClaw-Skill auf ClawHub veröffentlicht für Apple Music Suche und Wiedergabe

Entwickler misst Frustration mit 'F-Bombs pro tausend Prompts'-Metrik über 44.212 Claude Code-Logs