GitHub Copilot wechselt zu nutzungsbasierter Preisgestaltung: Das Ende subventionierter KI-Programmierung

GitHub Copilot stellt zum 1. Juni 2026 alle Tarife auf eine nutzungsbasierte Abrechnung um, wie Microsoft gestern bestätigte. Statt fester Anfragekontingente werden die Nutzer basierend auf den tatsächlichen Rechenkosten der von ihnen verwendeten Modelle belastet. Laut Ankündigung kann eine agentische Copilot-Sitzung inzwischen weit mehr kosten als ein schneller Chat – und Microsoft hat diese Kosten bisher übernommen. Laut dem Wall Street Journal (Oktober 2023) verlor Microsoft durchschnittlich über 20 $/Monat pro Nutzer, wobei einige Vielnutzer bis zu 80 $/Monat kosteten.
Wichtige Details
- Preisverschiebung: Nutzer eines 19 $-Tarifs erhalten Token im Wert von 19 $ – keine unbegrenzten Anfragen mehr. Das alte Premium-Anfragenmodell wird eingestellt.
- Agentische Nutzung: Das Produkt hat sich zu einer „agentischen Plattform“ entwickelt, die mehrstündige autonome Codierungssitzungen ermöglicht. Diese Sitzungen verbrauchen deutlich mehr Rechenleistung als einfache Inline-Vorschläge.
- Subventionsende: Microsoft nannte dies „einen wichtigen Schritt hin zu einem nachhaltigen, zuverlässigen Copilot-Geschäft“. Übersetzt: Sie können die fast 2 Millionen Nutzer nicht länger subventionieren.
- Nutzerreaktionen: Viele Nutzer auf HN und in sozialen Medien bezeichnen das Produkt als „tot“ und „komplett ruiniert“.
Kontext: Die breitere KI-Preiskrise
Ed Zitrons Analyse führt dies auf die grundlegende Ökonomie generativer KI zurück: Fast jeder Dienst – Copilot, OpenAI, Anthropic, Perplexity, Lovable – verkauft Abonnements unterhalb der tatsächlichen Inferenzkosten. So bietet Lovable 100 monatliche Credits plus 25 $ Cloud-Hosting für 25 $/Monat; Anthropics Claude Pro kostet 20 $/Monat. Diese Preise stützen sich auf Risikokapitalsubventionen. Wie Zitron es ausdrückt: „Die Ökonomie der KI ergibt keinen Sinn.“ Salesforces Agentforce verlangt 2 $ pro Gespräch, was selbst Unternehmensbudgets möglicherweise nicht stemmen können.
Was Entwickler wissen müssen
- Wenn Sie Copilot intensiv nutzen, rechnen Sie mit einer Abrechnung entsprechend der Nutzung – kein Pauschalzugang mehr.
- Erwägen Sie den Umstieg auf selbst gehostete Modelle (z. B. über Ollama oder vLLM) zur Kostenkontrolle.
- Behalten Sie Ihren Token-Verbrauch im Auge: Typische agentische Sitzungen können monatliche Credits schnell aufbrauchen.
Die Umstellung spiegelt einen breiteren Branchentrend wider: Die Ära der subventionierten KI geht zu Ende, und die Kosten werden an die Nutzer weitergegeben.
📖 Lesen Sie die vollständige Quelle: HN AI Agents
👀 Siehe auch

Internet-Archive-Sperrung gefährdet die Bewahrung der Web-Geschichte
Große Verlage, darunter The New York Times, blockieren Internet Archive-Crawler mit technischen Maßnahmen, die über robots.txt hinausgehen, und riskieren damit den Verlust historischer Webaufzeichnungen. Das Wayback Machine des Archivs enthält über eine Billion archivierte Seiten, und Wikipedia verlinkt auf 2,6 Millionen erhaltene Nachrichtenartikel in 249 Sprachen.

Beweis der Modellidentität mit der Modellverpackungstechnologie von Tinfoil
Tinfoils Modelwrap sorgt dafür, dass Inferenzanbieter die genauen Modellgewichte bereitstellen, die sie behaupten, und verwendet dabei kryptografische Verpflichtungen, die von sicheren Enklaven überprüft werden.

Nano-Native-Marktplatz ebnet den Weg für die Zusammenarbeit autonomer Agenten mit NanoBazaar.
NanoBazaar, der neue nano-native Marktplatz, revolutioniert die Zusammenarbeit zwischen Agenten, indem er KI-Codierungsagenten ermöglicht, autonom und effizient zu kooperieren. Entdecken Sie, wie diese innovative Plattform maschinengetriebene Transaktionen ermöglicht.

Claudes Spracherkennungsbeschränkungen und Benutzer-Workaround mit Spokenly und Parakeet TDT
Ein Benutzer berichtet, dass Claudes eingebaute Mikrofontranskription im Vergleich zu ChatGPT ungenau ist und mehr Arbeit verursacht, als sie spart. Sie haben eine Problemumgehung mit Spokenly auf dem Mac unter Verwendung von NVIDIAs Parakeet TDT-Modell für verbesserte Leistung implementiert.