GitHub Copilot stellt auf nutzungsbasierte Abrechnung nach Token-Verbrauch um und ersetzt Premium-Anfragen am 1. Juni 2026

GitHub hat angekündigt, dass alle Copilot-Tarife am 1. Juni 2026 auf verbrauchsabhängige Abrechnung umgestellt werden. Das aktuelle System der Premium-Anfrageeinheiten (PRU) wird durch GitHub AI Credits ersetzt, die pro Token (Eingabe-, Ausgabe- und zwischengespeicherte Token) zu den veröffentlichten API-Preisen pro Modell verbraucht werden.
Wichtige Änderungen
- Tarifpreise unverändert: Pro 10 $/Monat, Pro+ 39 $/Monat, Business 19 $/Benutzer/Monat, Enterprise 39 $/Benutzer/Monat.
- Monatliche AI Credits inklusive: Jeder kostenpflichtige Tarif enthält Credits in Höhe seines monatlichen Preises. Beispielsweise erhält Copilot Pro monatlich 10 $ an Credits.
- Keine Fallback-Modelle mehr: Wenn die Credits aufgebraucht sind, wird die Nutzung gestoppt, es sei denn, Admin-Budgets erlauben Überschreitungen zu den veröffentlichten Preisen.
- Code-Vervollständigungen und Next Edit Suggestions bleiben kostenlos – sie verbrauchen keine Credits.
- Copilot-Code-Review verbraucht Actions-Minuten zusätzlich zu den AI Credits.
- Benutzer von Jahrestarifen behalten die PRU-basierte Preisgestaltung bis zum Ablauf des Tarifs, aber die Modellmultiplikatoren steigen ab dem 1. Juni. Sie können zu monatlichen Tarifen mit anteiligen Credits wechseln.
- Business/Enterprise erhalten Aktionscredits für Juni–August 2026: Business 30 $/Monat, Enterprise 70 $/Monat pro Benutzer.
- Gepoolte inklusive Nutzung über Organisationen hinweg verhindert brachliegende Credits.
- Admin-Budgetkontrollen auf Enterprise-, Kostenstellen- und Benutzerebene, um Ausgaben zu begrenzen.
Grund für die Änderung
Agentische Nutzung (lange, mehrschrittige Sitzungen) verursacht viel höhere Inferenzkosten. Im alten Modell kosteten eine schnelle Chat-Anfrage und eine mehrstündige autonome Sitzung gleich viel. Die verbrauchsabhängige Abrechnung passt die Kosten an die tatsächliche Rechenleistung an, was GitHub für Nachhaltigkeit und Dienstzuverlässigkeit für notwendig hält.
Vorschau-Tool
Eine Vorschau der Abrechnung wird Anfang Mai auf der Seite „Abrechnungsübersicht“ verfügbar sein. Benutzer und Administratoren können dann die voraussichtlichen Kosten vor der Umstellung im Juni einsehen.
Für Benutzer von Einzeltarifen: GitHub hat kürzlich den Selbstkauf von Business-Tarifen pausiert und Nutzungslimits als vorbereitende Maßnahme angepasst. Diese Limits werden gelockert, sobald die Abrechnung live geht.
📖 Vollständige Quelle lesen: HN LLM Tools
👀 Siehe auch

Veröffentlichung von Claude-Code v2.1.25: Fehlerbehebung für Validierungsfehler
Claude-Code v2.1.25 behebt ein Problem mit der Validierung der Beta-Header, das Gateway-Nutzer auf Bedrock und Vertex betrifft, mit einer spezifischen Umgebungsvariable als Workaround.

Claude bietet zusätzliches Nutzungsguthaben für Pro-, Max- und Team-Tarife an.
Claude bietet Abonnenten der Pro-, Max- und Team-Pläne einen einmaligen zusätzlichen Nutzungsguthaben in Höhe ihres Abonnementpreises. Der Guthaben kann für Claude, Claude Code, Claude Cowork und Drittanbieterprodukte verwendet werden.

Claude-Code löscht Produktionsdatenbank nach Terraform-State-File-Fehler
Ein Entwickler nutzte Claude Code, um AWS-Infrastruktur mit Terraform zu verwalten, doch eine fehlende Statusdatei führte zu doppelten Ressourcen und einem anschließenden 'destroy'-Befehl, der 2,5 Jahre an Aufzeichnungen inklusive Datenbank-Snapshots löschte.

Qwen3.5-27B-FP8-Leistungsbenchmarks mit OpenClaw-Agenten
Tests zeigen, dass Qwen3.5-27B-FP8 sechs OpenClaw-Agenten gleichzeitig ausführen kann, wobei der Durchsatz auf 120 Token/Sekunde skaliert. Das SGLang-Framework mit Prefix-Caching reduziert das Prefill von 100K Kontext von 10 Sekunden auf 200ms.