AWS Lambda MicroVMs: VM-Isolierung für Benutzer- und KI-generierten Code mit Suspend/Resume bis zu 8 Stunden

AWS hat Lambda MicroVMs angekündigt, eine neue serverlose Compute-Primitive, die VM-Isolation für die Ausführung von Benutzer- oder KI-generiertem Code bietet. Es basiert auf Firecracker, derselben Virtualisierungstechnologie, die über 15 Billionen monatliche Lambda-Funktionsaufrufe unterstützt. Das zentrale Wertversprechen: Sie müssen nicht mehr zwischen Isolation, Startgeschwindigkeit und Zustandsbeibehaltung wählen.
Wichtige Funktionen
- VM-Isolation pro Benutzer oder pro Auftrag – jeder erhält eine eigene MicroVM, was den Schadensbereich durch bösartigen oder fehlerhaften Code begrenzt.
- Nahezu sofortiger Start und Resume über Firecracker-MicroVMs.
- Zustandsspeicherung – Sie können die Ausführung für bis zu 8 Stunden anhalten und fortsetzen.
- HTTPS-URL pro MicroVM mit Unterstützung für HTTP/2, gRPC und WebSockets.
Erste Schritte
Erstellen Sie ein MicroVM-Image aus Ihrem Dockerfile und starten Sie dann MicroVMs aus diesem Image. Jede MicroVM erhält eine dedizierte HTTPS-URL für die Konnektivität.
Anwendungsfälle
Multi-Tenant-Anwendungen, die von Endbenutzern oder KI bereitgestellten Code ausführen: interaktive Programmierumgebungen, Datenanalyseplattformen, Programmierassistenten, Schwachstellen-Scanning-Plattformen.
Preise
Sie zahlen für die Basis-Compute-Ressourcen, solange Ihre MicroVM läuft, und nur für die aktive Nutzungsdauer zusätzlicher Ressourcen, die verbraucht werden, wenn Ihre Arbeitslast die Basis überschreitet.
Verfügbarkeit
Verfügbar ab 22. Juni 2026 in USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), Asien-Pazifik (Tokio) und Europa (Irland). Zugänglich über AWS Lambda-Konsole, AWS CloudFormation, AWS Cloud Development Kit oder das Agent Toolkit for AWS.
📖 Vollständige Quelle lesen: HN LLM Tools
👀 Siehe auch

Ångstrom nutzte Claude Code, um ein Modell zu trainieren, das Metas UMA-OMC schlug — 100k GPU-Jobs auf Spot
Ångstrom (YC S24) trainierte CSP-MACE-Å, ein ML-Modell, das 10.000x schneller ist als DFT bei gleicher Genauigkeit und Metas UMA-OMC bei der Kristallstrukturvorhersage übertrifft. Sie nutzten Claude Code, um 100.000 GPU-Jobs auf Multi-Cloud-Spot-Instanzen über die Anycloud CLI zu orchestrieren.

Anthropic zahlt SpaceX 15 Mrd. $ pro Jahr für Rechenleistung bis 2029
Eine SpaceX-IPO-Einreichung zeigt, dass Anthropic 1,25 Mrd. USD pro Monat bis Mai 2029 für Rechenleistung zahlt. Der Deal unterstützt KI-Training in den Einrichtungen Colossus 1 & 2.

Opus 4.6 überragend in Forschung, Gemini 3.1 Pro besser in Vorhersage-Benchmark
Ein Benchmark mit 1.417 binären Prognosefragen trennt Forschungs- und Urteilsleistung: Claude Opus 4.6 führt bei agentischer Recherche, Gemini 3.1 Pro punktet bei Kalibrierung auf festen Beweisen. GPT-5.4 und Grok 4.20 zeigen kaum Unterschiede zwischen den Bedingungen.

RTX 5000 PRO 48GB liefert 4400 Tok/s Präzisions-Caching für Qwen3.6-27B
Ein PC-Neuling berichtet von 4400 tok/s Promptverarbeitung und 80 tok/s Generierung mit Qwen3.6-27B-FP8 und vollpräzisem KV-Cache auf einer einzelnen RTX 5000 Pro 48GB, unter Verwendung von vLLM und Claude Code.