Plataforma de IA de Cloudflare: Capa de Inferencia Unificada para Agentes de IA

✍️ OpenClawRadar📅 Publicado: 18 de abril de 2026🔗 Source
Plataforma de IA de Cloudflare: Capa de Inferencia Unificada para Agentes de IA
Ad

Lo que ofrece la Plataforma de IA de Cloudflare

Cloudflare ha expandido sus capacidades de IA en una capa de inferencia unificada diseñada específicamente para agentes de IA. La plataforma aborda el desafío de que los modelos de IA cambian rápidamente y la necesidad de usar múltiples modelos para diferentes tareas dentro de los flujos de trabajo de agentes.

Características clave e implementación

La oferta principal es una API para acceder a cualquier modelo de IA de cualquier proveedor. Para los usuarios de Workers, puedes llamar a modelos de terceros utilizando el mismo enlace AI.run() que ya se usa para Workers AI. Cambiar entre proveedores requiere solo un cambio de una línea de código.

const response = await env.AI.run('@cf/moonshotai/kimi-k2.5', {
    prompt: 'What is AI Gateway?'
}, {
    metadata: {
        "teamId": "AI",
        "userId": 12345
    }
});

La plataforma proporciona acceso a más de 70 modelos de más de 12 proveedores, incluidos Alibaba Cloud, AssemblyAI, Bytedance, Google, InWorld, MiniMax, OpenAI, Pixverse, Recraft, Runway y Vidu. Las ofertas de modelos ahora incluyen modelos de imagen, video y voz para construir aplicaciones multimodales.

Ad

Gestión de costos y soporte BYOM

Todos los gastos de IA se pueden gestionar en un solo lugar a través de AI Gateway. Al incluir metadatos personalizados con las solicitudes, puedes obtener desgloses de costos por atributos como usuarios gratuitos versus pagados, clientes individuales o flujos de trabajo específicos.

Para necesidades de modelos personalizados, Cloudflare está trabajando en permitir que los usuarios traigan sus propios modelos a Workers AI utilizando la tecnología Cog de Replicate. Esto implica contenerizar modelos de aprendizaje automático con un archivo cog.yaml y código de inferencia de Python, abstrayendo las dependencias de CUDA, versiones de Python y carga de pesos.

Actualizaciones recientes y disponibilidad

Las adiciones recientes incluyen puertas de enlace predeterminadas sin configuración, reintentos automáticos en fallos ascendentes y controles de registro más granulares. El soporte de API REST para usuarios que no son de Workers llegará en las próximas semanas.

📖 Leer la fuente completa: HN AI Agents

Ad

👀 Ver también

AgentLens: Herramienta de Observabilidad para Flujos de Trabajo de IA Multi-Agente
Herramientas

AgentLens: Herramienta de Observabilidad para Flujos de Trabajo de IA Multi-Agente

AgentLens proporciona trazabilidad unificada en Ollama, vLLM, Anthropic y OpenAI, con seguimiento de costos, un servidor MCP para consultar estadísticas desde Claude Code y una CLI para verificaciones en línea. Es autoalojado y se ejecuta localmente mediante Docker.

OpenClawRadar
Vibe Remote: Puente Móvil para Acceder al Código de Claude desde Cualquier Lugar
Herramientas

Vibe Remote: Puente Móvil para Acceder al Código de Claude desde Cualquier Lugar

Vibe Remote es una aplicación móvil que proporciona acceso remoto a entornos de desarrollo de Claude Code desde un teléfono, permitiendo a los usuarios mantener sus configuraciones locales, historial de Git y estructura de archivos sin requerir Tailscale o configuraciones complejas de VPN.

OpenClawRadar
RunAnywhere RCLI: Pipeline de IA de Voz en Dispositivo para Apple Silicon
Herramientas

RunAnywhere RCLI: Pipeline de IA de Voz en Dispositivo para Apple Silicon

RunAnywhere ha lanzado RCLI, una canalización de IA de voz de código abierto para macOS que ejecuta STT, LLM y TTS completamente en dispositivos Apple Silicon. La herramienta utiliza su motor de inferencia propietario MetalRT y afirma mejoras significativas de rendimiento sobre las soluciones existentes.

OpenClawRadar
Deja de reenseñar a Claude Code en cada sesión: usa una configuración persistente
Herramientas

Deja de reenseñar a Claude Code en cada sesión: usa una configuración persistente

Un usuario de Reddit explica cómo ahorró 20 minutos por sesión escribiendo una configuración persistente para Claude Code, eliminando la dirección repetitiva y logrando un 33% más de rapidez en las finalizaciones.

OpenClawRadar