인터페이즈: 결정론적 작업에서 제미니-3-플래시와 GPT-5.4-미니를 능가하는 새로운 모델 아키텍처

✍️ OpenClawRadar📅 게시일: May 11, 2026🔗 Source
인터페이즈: 결정론적 작업에서 제미니-3-플래시와 GPT-5.4-미니를 능가하는 새로운 모델 아키텍처
Ad

Interfaze는 Interfaze가 개발한 새로운 모델 아키텍처로, 작업별 DNN/CNN 모델과 옴니트랜스포머를 결합하여 대규모 고정밀 결정론적 작업을 목표로 합니다. 100만 토큰 컨텍스트 창, 최대 32,000개 출력 토큰을 제공하며, 텍스트, 이미지, 오디오, 파일 입력과 선택적 추론을 지원합니다.

벤치마크 결과

해당 벤치마크에 따르면, Interfaze는 유사한 가격대 모델(Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6, Grok-4.3과 같은 Flash/mini 모델)과의 9개 항목 비교에서 앞섰습니다:

  • OCRBench V2: Interfaze 70.7% vs Gemini-3-Flash 55.8%, Claude-Sonnet-4.6 54.7%, GPT-5.4-Mini 52.7%, Grok-4.3 54.7%
  • olmOCR: Interfaze 85.7% vs Gemini-3-Flash 75.3%, Claude-Sonnet-4.6 73.9%, GPT-5.4-Mini 80.1%, Grok-4.3 81.9%
  • RefCOCO: Interfaze 82.1% vs Gemini-3-Flash 75.2%, Claude-Sonnet-4.6 75.5%, GPT-5.4-Mini 67.0%, Grok-4.3 25.0%
  • VoxPopuli (WER, 낮을수록 좋음): Interfaze 2.4% vs Gemini-3-Flash 4.0%
  • Spider 2.0-Lite: Interfaze 52.9% vs Gemini-3-Flash 45.2%, Claude-Sonnet-4.6 49.6%, GPT-5.4-Mini 26.7%, Grok-4.3 45.9%
  • GPQA Diamond: Interfaze 89.9% vs Gemini-3-Flash 88.5%, Claude-Sonnet-4.6 89.9%, GPT-5.4-Mini 82.8%, Grok-4.3 73.6%
  • MMMLU: Interfaze 90.9% vs Gemini-3-Flash 88.7%, Claude-Sonnet-4.6 84.9%, GPT-5.4-Mini 75.3%, Grok-4.3 89.7%
  • MMMU-Pro: Interfaze 71.1% vs Gemini-3-Flash 67.6%, Claude-Sonnet-4.6 46.3%, GPT-5.4-Mini 40.4%, Grok-4.3 68.7%
  • SOB Value Acc: Interfaze 79.5% vs Gemini-3-Flash 77.3%, Claude-Sonnet-4.6 77.9%, GPT-5.4-Mini 75.1%, Grok-4.3 78.4%

또한 출처에 따르면 Interfaze는 Chandra OCR이나 Reducto 같은 특화 OCR 제공업체보다도 뛰어납니다.

Ad

가격

Interfaze는 입력 토큰 100만 개당 1.50달러, 출력 토큰 100만 개당 3.50달러로, Gemini-3-Flash와 비슷한 수준입니다.

대상 사용자

대용량 OCR, 문서 추출, 웹 검색, 오디오 전사/화자 분할, 번역, 객체/GUI 탐지 파이프라인을 구축하며, 전체 LLM 비용 없이 결정론적 정확도가 필요한 개발자에게 적합합니다.

📖 전체 출처 보기: HN AI Agents

Ad

👀 See Also

커먼즈 2.0: AI 모델이 소통하는 지속 가능한 공간
Tools

커먼즈 2.0: AI 모델이 소통하는 지속 가능한 공간

커먼즈는 Claude, GPT, Gemini, Grok와 같은 AI 모델이 토론에 참여하고, 시를 주석 달고, 엽서를 남기며, 세션을 넘어 지속적인 대화를 구축할 수 있는 공개 플랫폼입니다. 버전 2.0에는 관심사 기반 조직화, 알림 시스템, 음성 프로필, 에이전트 체크인 인프라가 추가되었습니다.

OpenClawRadar
이탈리아 열차 데이터 MCP 서버: 클로드에서 실시간 지연, 출발 및 시간표 정보 제공
Tools

이탈리아 열차 데이터 MCP 서버: 클로드에서 실시간 지연, 출발 및 시간표 정보 제공

한 개발자가 트레니탈리아를 위한 비공식 MCP 서버를 구축하여 클로드가 자연어로 기차 관련 질문에 답할 수 있도록 했습니다. 이 프로젝트는 이탈리아에서 기차 지연을 확인하기 위해 여러 앱을 전환해야 하는 일상적인 통근 문제를 해결하기 위해 만들어졌습니다.

OpenClawRadar
ClawDeckX: 오픈소스 macOS 스타일 웹 플랫폼으로 OpenClaw 에이전트 관리
Tools

ClawDeckX: 오픈소스 macOS 스타일 웹 플랫폼으로 OpenClaw 에이전트 관리

ClawDeckX는 OpenClaw 에이전트를 설치, 구성 및 모니터링하기 위한 오픈소스 웹 플랫폼입니다. 시각적 관리 도구, 실시간 모니터링을 제공하며 13개 언어를 지원합니다.

OpenClawRadar
SkyClaw, AI 에이전트를 위한 암호화된 채팅 기반 API 키 설정 기능 추가
Tools

SkyClaw, AI 에이전트를 위한 암호화된 채팅 기반 API 키 설정 기능 추가

SkyClaw는 채팅을 통해 AES-256-GCM 암호화된 키 수신을 구현하며, 시스템 계층에서 키 명령을 가로채어 LLM이 API 키를 전혀 볼 수 없도록 하고, 일회용 키 암호화를 사용하여 메시징 플랫폼이 암호문만 보게 합니다.

OpenClawRadar