Cloudflares KI-Plattform: Einheitliche Inferenzschicht für KI-Agenten

Was Cloudflares KI-Plattform bietet
Cloudflare hat seine KI-Fähigkeiten zu einer einheitlichen Inferenzschicht erweitert, die speziell für KI-Agenten entwickelt wurde. Die Plattform adressiert die Herausforderung, dass KI-Modelle sich schnell ändern und die Notwendigkeit, mehrere Modelle für verschiedene Aufgaben innerhalb agentenbasierter Workflows zu nutzen.
Wichtige Funktionen und Implementierung
Das Kernangebot ist eine API, um auf jedes KI-Modell von jedem Anbieter zuzugreifen. Für Workers-Benutzer können Sie Drittanbietermodelle mit derselben AI.run()-Bindung aufrufen, die bereits für Workers AI verwendet wird. Der Wechsel zwischen Anbietern erfordert nur eine einzeilige Codeänderung.
const response = await env.AI.run('@cf/moonshotai/kimi-k2.5', {
prompt: 'What is AI Gateway?'
}, {
metadata: {
"teamId": "AI",
"userId": 12345
}
});Die Plattform bietet Zugriff auf über 70 Modelle von mehr als 12 Anbietern, darunter Alibaba Cloud, AssemblyAI, Bytedance, Google, InWorld, MiniMax, OpenAI, Pixverse, Recraft, Runway und Vidu. Die Modellangebote umfassen jetzt Bild-, Video- und Sprachmodelle für den Aufbau multimodaler Anwendungen.
Kostenmanagement und BYOM-Unterstützung
Alle KI-Ausgaben können über AI Gateway an einem Ort verwaltet werden. Durch die Einbeziehung benutzerdefinierter Metadaten in Anfragen erhalten Sie Kostenaufschlüsselungen nach Attributen wie kostenlose vs. zahlende Benutzer, einzelne Kunden oder bestimmte Workflows.
Für benutzerdefinierte Modellanforderungen arbeitet Cloudflare daran, Benutzern zu ermöglichen, ihre eigenen Modelle mit Replicates Cog-Technologie zu Workers AI mitzubringen. Dies beinhaltet die Containerisierung von Machine-Learning-Modellen mit einer cog.yaml-Datei und Python-Inferenzcode, wodurch CUDA-Abhängigkeiten, Python-Versionen und Gewichtsladung abstrahiert werden.
Aktuelle Updates und Verfügbarkeit
Zu den neuesten Ergänzungen gehören Standard-Gateways ohne Einrichtung, automatische Wiederholungsversuche bei Upstream-Fehlern und granularere Protokollierungssteuerungen. Die REST-API-Unterstützung für Nicht-Workers-Benutzer wird in den kommenden Wochen verfügbar sein.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Pleng: Selbstgehostete Cloud-Plattform mit KI-gesteuerter Infrastrukturverwaltung
Pleng ist eine unter der AGPL-3.0-Lizenz stehende, selbst gehostete Cloud-Plattform, die einen KI-Agenten (derzeit Claude) nutzt, um Infrastruktur über Telegram-Bot-Befehle zu verwalten. Sie ermöglicht das Deployment von GitHub-Repositories oder lokalen Verzeichnissen mit automatischem Traefik-Routing, Let's Encrypt SSL und grundlegender Analyse.

Via Open Source Universal Integration Layer verbindet KI-Tools mit einem gemeinsamen Kontextbus
Via ist eine quelloffene universelle Integrationsschicht, die Claude, Cursor, Windsurf, ChatGPT, LangChain und andere KI-Tools mit einem gemeinsamen Kontext-, Aufgaben- und Speicherbus verbindet, sodass Arbeit den Benutzern über Tools, Sitzungen und Maschinen hinweg folgen kann.

AGENTS-COLLECTION: 129 Claude-Code-Agents in einem Repository organisiert
Ein Entwickler hat 129 Claude-Code-Agenten in einem einzigen Repository im ~/.claude/agents/-Format zusammengestellt, die mit einem einfachen Kopierbefehl installiert werden können. Die Sammlung umfasst das vollständige Agency-Agents-System mit 68 persönlichkeitsgesteuerten Agenten aus verschiedenen Disziplinen sowie zusätzliche Agenten für Multi-Agent-Team-Workflows.

MLJAR Studio: Lokaler KI-Datenanalyst, der reproduzierbare Notebooks erstellt
MLJAR Studio ist eine Desktop-App, die Fragen in natürlicher Sprache in lokal ausgeführte Python-Notebooks umwandelt, mit AutoML für tabellarische Daten und Unterstützung für lokale LLMs über Ollama.