Cloudflare의 AI 플랫폼: AI 에이전트를 위한 통합 추론 레이어

Cloudflare AI 플랫폼이 제공하는 것
Cloudflare는 AI 에이전트를 위해 특별히 설계된 통합 추론 계층으로 AI 기능을 확장했습니다. 이 플랫폼은 AI 모델이 빠르게 변화하고 에이전트 워크플로우 내에서 다양한 작업에 여러 모델을 사용해야 하는 과제를 해결합니다.
주요 기능 및 구현
핵심 제공 사항은 모든 제공업체의 AI 모델에 접근할 수 있는 하나의 API입니다. Workers 사용자의 경우, Workers AI에 이미 사용 중인 동일한 AI.run() 바인딩을 사용하여 타사 모델을 호출할 수 있습니다. 제공업체 간 전환은 한 줄의 코드 변경만 필요합니다.
const response = await env.AI.run('@cf/moonshotai/kimi-k2.5', {
prompt: 'AI Gateway란 무엇인가요?'
}, {
metadata: {
"teamId": "AI",
"userId": 12345
}
});이 플랫폼은 Alibaba Cloud, AssemblyAI, Bytedance, Google, InWorld, MiniMax, OpenAI, Pixverse, Recraft, Runway, Vidu를 포함한 12개 이상의 제공업체에서 70개 이상의 모델에 대한 접근을 제공합니다. 모델 제공에는 이제 멀티모달 애플리케이션 구축을 위한 이미지, 비디오, 음성 모델이 포함됩니다.
비용 관리 및 BYOM 지원
모든 AI 지출은 AI Gateway를 통해 한 곳에서 관리할 수 있습니다. 요청에 사용자 정의 메타데이터를 포함하면 무료 대 유료 사용자, 개별 고객 또는 특정 워크플로우와 같은 속성별로 비용 내역을 확인할 수 있습니다.
사용자 정의 모델 요구 사항의 경우, Cloudflare는 Replicate의 Cog 기술을 사용하여 사용자가 자신의 모델을 Workers AI로 가져올 수 있도록 작업 중입니다. 이는 cog.yaml 파일과 Python 추론 코드로 머신러닝 모델을 컨테이너화하여 CUDA 종속성, Python 버전 및 가중치 로딩을 추상화하는 것을 포함합니다.
최근 업데이트 및 가용성
최근 추가 사항에는 설정 없이 사용 가능한 기본 게이트웨이, 업스트림 장애 시 자동 재시도, 더 세분화된 로깅 제어가 포함됩니다. 비-Workers 사용자를 위한 REST API 지원은 몇 주 내에 제공될 예정입니다.
📖 전체 원문 읽기: HN AI Agents
👀 See Also

Pali v0.1: 재현 가능한 벤치마크를 갖춘 LLM용 오픈 소스 메모리 인프라
Pali는 Go로 구축된 단일 바이너리로, 다중 테넌트 API, 하이브리드 검색, 플러그 앤 플레이 확장 기능을 갖춘 LLM용 오픈 소스 메모리 인프라입니다. v0.1 릴리스에는 다양한 구성에 대한 성능 지표를 보여주는 재현 가능한 결과가 포함된 벤치마크 제품군이 포함되어 있습니다.

모바일 하네스: 클로드 에이전트를 위한 브라우저 사용 기술을 모바일 앱으로 확장
Mobile Harness는 Claude/에이전트가 MobAI를 실행 계층으로 사용하여 재사용 가능한 모바일 앱 기술(Reddit, Instagram, TikTok)을 제공합니다. 실제 기기, 에뮬레이터, 시뮬레이터에서 작동하며 무료 일일 할당량이 있습니다.

클로드 코드 스킬: 자동화된 프로젝트 스캐폴딩
한 개발자가 React, Next.js, Node.js API, Turborepo 모노레포를 위한 명령어로 풀스택 프로젝트 설정을 자동화하는 Claude Code 스킬을 구축했습니다. 이 스킬은 최신 의존성을 가져오고, 50개 이상의 통합을 지원하며, MIT 라이선스로 제공됩니다.

DebugBase: AI 코딩 에이전트를 위한 MCP 기반 집단 오류 지식 베이스
DebugBase는 MCP 호환 도구로, Next.js 하이드레이션 불일치나 TypeScript 해결 문제와 같은 일반적인 오류에 대한 알려진 수정 사항을 AI 코딩 에이전트가 확인할 수 있는 공유 지식 베이스를 제공합니다. 11개의 MCP 도구를 포함하며 실제 에이전트 세션에서 가져온 58개의 오류/수정 쌍으로 사전 구성되어 있습니다.