70+ KI-Modelle per API: Cloudflares einheitliche Inferenzschicht

Was Cloudflares KI-Plattform bietet

Cloudflare hat seine KI-Fähigkeiten zu einer einheitlichen Inferenzschicht erweitert, die speziell für KI-Agenten entwickelt wurde. Die Plattform adressiert die Herausforderung, dass KI-Modelle sich schnell ändern und die Notwendigkeit, mehrere Modelle für verschiedene Aufgaben innerhalb agentenbasierter Workflows zu nutzen.

Wichtige Funktionen und Implementierung

Das Kernangebot ist eine API, um auf jedes KI-Modell von jedem Anbieter zuzugreifen. Für Workers-Benutzer können Sie Drittanbietermodelle mit derselben AI.run()-Bindung aufrufen, die bereits für Workers AI verwendet wird. Der Wechsel zwischen Anbietern erfordert nur eine einzeilige Codeänderung.

const response = await env.AI.run('@cf/moonshotai/kimi-k2.5', {
    prompt: 'What is AI Gateway?'
}, {
    metadata: {
        "teamId": "AI",
        "userId": 12345
    }
});

Die Plattform bietet Zugriff auf über 70 Modelle von mehr als 12 Anbietern, darunter Alibaba Cloud, AssemblyAI, Bytedance, Google, InWorld, MiniMax, OpenAI, Pixverse, Recraft, Runway und Vidu. Die Modellangebote umfassen jetzt Bild-, Video- und Sprachmodelle für den Aufbau multimodaler Anwendungen.

Kostenmanagement und BYOM-Unterstützung

Alle KI-Ausgaben können über AI Gateway an einem Ort verwaltet werden. Durch die Einbeziehung benutzerdefinierter Metadaten in Anfragen erhalten Sie Kostenaufschlüsselungen nach Attributen wie kostenlose vs. zahlende Benutzer, einzelne Kunden oder bestimmte Workflows.

Für benutzerdefinierte Modellanforderungen arbeitet Cloudflare daran, Benutzern zu ermöglichen, ihre eigenen Modelle mit Replicates Cog-Technologie zu Workers AI mitzubringen. Dies beinhaltet die Containerisierung von Machine-Learning-Modellen mit einer cog.yaml-Datei und Python-Inferenzcode, wodurch CUDA-Abhängigkeiten, Python-Versionen und Gewichtsladung abstrahiert werden.

Aktuelle Updates und Verfügbarkeit

Zu den neuesten Ergänzungen gehören Standard-Gateways ohne Einrichtung, automatische Wiederholungsversuche bei Upstream-Fehlern und granularere Protokollierungssteuerungen. Die REST-API-Unterstützung für Nicht-Workers-Benutzer wird in den kommenden Wochen verfügbar sein.

📖 Read the full source: HN AI Agents

Cloudflares KI-Plattform: Einheitliche Inferenzschicht für KI-Agenten

Was Cloudflares KI-Plattform bietet

Wichtige Funktionen und Implementierung

Kostenmanagement und BYOM-Unterstützung

Aktuelle Updates und Verfügbarkeit

👀 Siehe auch

Agent Skill Harbor: GitHub-native Skillverwaltung für KI-Agententeams

Reddit-Nutzer testet Selbstlernfunktion von Hermes-KI-Agent und findet kritische Mängel

Extrahieren von OpenClaw-Komponenten: Die Erfahrung eines Entwicklers mit Lane Queue und Speichersystem

Ctxpact: Kontext-Kompaktierungs-Proxy für lokale LLMs