Nvidia RTX Spark: 1-Petaflop-Superchip bringt lokale KI-Agenten auf Windows-PCs

Nvidia hat heute den RTX Spark vorgestellt, einen neuen Superchip, der 1 Petaflop KI-Rechenleistung auf Windows-PCs bringt und speziell für den Betrieb persönlicher KI-Agenten vor Ort entwickelt wurde. Der Chip kombiniert eine Blackwell-RTX-GPU (6.144 CUDA-Kerne, Tensor-Kerne der fünften Generation mit FP4), eine 20-Core-Grace-CPU und bis zu 128 GB Unified Memory, die über NVLink-C2C verbunden sind. MediaTek trug zum Design der individuellen Arm-basierten CPU für Energieeffizienz bei.
Wichtige Spezifikationen und Funktionen
- KI-Leistung: 1 Petaflop (FP4)
- GPU: Blackwell RTX mit 6.144 CUDA-Kernen
- CPU: 20-Core NVIDIA Grace (Arm), gemeinsam mit MediaTek entwickelt
- Speicher: bis zu 128 GB Unified Memory
- Software-Stack: CUDA, RTX, DLSS, FP4, TensorRT, OptiX, Reflex, G-SYNC
Der RTX Spark kann LLMs mit 120 Milliarden Parametern und bis zu 1 Million Token Kontext lokal ausführen, 3D-Szenen mit über 90 GB rendern, 12K 4:2:2-Video bearbeiten, 4K-KI-Videos generieren und AAA-Spiele mit 1440p und über 100 fps spielen.
Windows-native Agentensicherheit
Nvidia und Microsoft arbeiten an neuen Windows-Sicherheitsprimitiven und der Nvidia OpenShell-Laufzeitumgebung, um sichere On-Device-Agenten zu ermöglichen. Die Sicherheitsschicht bietet Identität, Containment, Richtlinien und End-to-End-Sicherheit. OpenShell fügt benutzerdefinierte Richtlinien für Agentenfähigkeiten, intelligentes Query-Routing zu lokalen vs. Cloud-Modellen und PII-Maskierung in Cloud-gebundenen Abfragen hinzu.
Agent-Frameworks wie Hermes Agent und OpenClaw entwickeln Windows-Apps auf diesem Stack, die Cross-App-Workflows, Dateisuche, Bild-/Videogenerierung und Code-Plugin-Erstellung ermöglichen.
Verfügbarkeit
RTX Spark-betriebene schlanke Laptops (Akku für den ganzen Tag, Premium-Displays) und kompakte Desktops werden ab Herbst von ASUS, Dell, HP, Lenovo, Microsoft Surface und MSI ausgeliefert, Modelle von Acer und GIGABYTE folgen.
📖 Lesen Sie die vollständige Quelle: HN AI Agents
👀 Siehe auch

Claude-Code-Subagenten laden keine Fähigkeiten in Multi-Agenten-Systemen
Ein Entwickler berichtet, dass Subagenten in Claude Code v2.1.91 nicht auf Fähigkeiten zugreifen können, die im .claude/skills/-Verzeichnis definiert sind, obwohl diese Fähigkeiten in der Hauptsitzung einwandfrei funktionieren. Mehrere Ansätze – einschließlich Fähigkeiten in der Agent-Frontmatter, dem Skill-Tool, CLI-Flags und Agent Teams – schlagen alle fehl.

Benchmark zeigt, dass kleinere 4B-Modelle größere LLMs für Telefon-zu-Haus-Chatanwendungen übertreffen
Ein Benchmark von 8 lokalen LLMs für Telefon-zu-Heim-Chat-Anwendungen ergab, dass Gemma3:4B mit einer zusammengesetzten Fitnesspunktzahl von 88,7 gewann, obwohl es das kleinste Modell war. Es übertraf größere Modelle mit bis zu 24B Parametern aufgrund schnellerer Antwortzeiten und geringerer thermischer Belastung.
Claude Code System Prompts v2.1.139: Claude-Plattform auf AWS-Dokumenten, Zusammenfassungssicherheit, PowerShell-Tooling
CC 2.1.139 (+2.248 Tokens) fügt Referenzdokumentation zur Claude Platform auf AWS mit SigV4-Authentifizierung, sicherheitsbewahrender Zusammenfassung von Konversationen, einer PowerShell-Unix-Befehlsäquivalenztabelle sowie mehreren Verbesserungen von Fähigkeiten und Prompts hinzu.

Die KI-Ping-Pong: Wenn jede Antwort ein ChatGPT-Screenshot ist
Entwickler berichten, dass sie mit KI-generierten Antworten überschwemmt werden – von Kollegen, Chefs und sogar GitHub-Kommentatoren – die den Kontext ignorieren und Zeit verschwenden. Die HN-Diskussion zeigt eine wachsende Frustration.