Reverse Engineering des Apple Neural Engine für das Training von MicroGPT-Modellen

✍️ OpenClawRadar📅 Veröffentlicht: 1. März 2026🔗 Source
Reverse Engineering des Apple Neural Engine für das Training von MicroGPT-Modellen
Ad

Direkter Zugriff auf Apples Neural Engine

Ein Entwickler hat Apples CoreML-Framework umgangen, um direkt auf die Apple Neural Engine (ANE) auf einem M4 Mac mini zuzugreifen und eine benutzerdefinierte Trainingspipeline für kleine Sprachmodelle zu erstellen. Das Projekt umfasste das Reverse Engineering der privaten ANE-APIs mit Claude, gefolgt von Benchmarks und der Implementierung des Trainings ohne Apples empfohlene CoreML-Schnittstelle.

Technische Spezifikationen und Leistung

Die ANE auf dem M4-Chip bietet 38 TFLOPS an angegebener INT8-Rechenleistung, obwohl der Entwickler anmerkt, dass es sich tatsächlich um einen FP16-Prozessor handelt, wodurch die effektive Rechenleistung halbiert wird. Die Spitzenrechenleistung der ANE verbraucht nur 2,8 W, was eine Effizienz von 6,6 TFLOPS/Watt ergibt. Zum Vergleich: Metal GPU erreicht etwa 1 TFLOPS/Watt, während NVIDIAs H100 1,4 TFLOPS/Watt erreicht.

Trainingsimplementierung

Der Entwickler erstellte eine maßgeschneiderte Trainingspipeline, die erfolgreich ein 110M-Parameter-MicroGPT-Modell auf der ANE trainierte. Obwohl ein einzelner Chip größere Modelle praktisch nicht trainieren kann, schlägt der Entwickler vor, dass ein Cluster von ANE-Geräten theoretisch größere Modelle trainieren könnte. Selbst auf einem einzelnen Gerät sollte LoRA-Training für 3B- oder 7B-Parameter-Modelle machbar sein.

Ad

Warum auf NPUs trainieren?

Die Hauptmotivation ist die Energieeffizienz. Die Effizienz der ANE von 6,6 TFLOPS/Watt macht sie deutlich energieeffizienter als herkömmliche GPU-Trainingsmethoden, was besonders für Edge Computing und energiebewusste Entwicklung wertvoll ist.

Verfügbare Ressourcen

  • Reverse-Engineering-Dokumentation
  • Benchmark-Ergebnisse
  • Trainingsimplementierung (Work in Progress)
  • GitHub-Repository mit Code

Das Projekt zeigt, dass Apples Neural Engine, die normalerweise als Black Box behandelt wird, direkt für benutzerdefinierte KI-Trainingsworkflows genutzt werden kann und Entwicklern eine Alternative zum GPU-basierten Training mit überlegener Energieeffizienz bietet.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Nexus: Open-Source AI-zu-AI-Protokoll mit Discovery, Vertrauen und Zahlungen
Werkzeuge

Nexus: Open-Source AI-zu-AI-Protokoll mit Discovery, Vertrauen und Zahlungen

Nexus ist ein selbst gehostetes Protokoll, das KI-Agenten ermöglicht, sich gegenseitig zu entdecken, Bedingungen auszuhandeln, Antworten zu verifizieren und Mikrozahlungen ohne menschliches Eingreifen abzuwickeln. Es umfasst fünf Ebenen: Entdeckung, Vertrauen, Protokoll, Routing und Föderation, mit 66 Tests und MIT-Lizenz.

OpenClawRadar
Die Browsererweiterung "wearehere" scannt Websites auf Tracking- und Datenschutzrisiken.
Werkzeuge

Die Browsererweiterung "wearehere" scannt Websites auf Tracking- und Datenschutzrisiken.

wearehere ist eine Browser-Erweiterung, die Websites in zehn Kategorien wie Cookies, Tracker, Geräte-Fingerprinting und Dark Patterns scannt und sie basierend auf Datenschutzrisiken bewertet. Sie ist unter 200KB groß, läuft lokal im Browser und ist auch als npm-Paket für die Integration mit KI-Agenten über den barebrowse MCP-Server verfügbar.

OpenClawRadar
🦀
Werkzeuge

Gigacatalyst: Integrieren Sie einen KI-Builder in Ihre SaaS, damit Benutzer benutzerdefinierte Workflows erstellen können

Gigacatalyst ermöglicht es Ihnen, einen KI-gestützten App-Builder in Ihre SaaS-Lösung einzubetten. Nicht-technische Benutzer beschreiben Abläufe in natürlicher Sprache, und das System generiert kontrollierte Apps unter Verwendung Ihrer APIs, Ihres Datenmodells und Ihres Designsystems – mit integriertem Authentifizierung, Mandantenisolierung und Versionskontrolle.

OpenClawRadar
OpenClaw-Benutzer kritisiert Architektur und Sicherheitslücken des Tools
Werkzeuge

OpenClaw-Benutzer kritisiert Architektur und Sicherheitslücken des Tools

Ein Reddit-Nutzer beschreibt OpenClaw als das einzige Tool, das Agenten-Automatisierung so zugänglich macht, kritisiert jedoch dessen Architektur für das Fehlen einer Kontrollebene für Dateioperationen, eines geschützten Kernels, eines ordentlichen Kontextmanagements sowie integrierter Versionierung oder Tests.

OpenClawRadar