1비트 분재 이미지 4B: 바이너리/터너리 FLUX를 통한 온디바이스 이미지 생성

✍️ OpenClawRadar📅 게시일: June 1, 2026🔗 Source
1비트 분재 이미지 4B: 바이너리/터너리 FLUX를 통한 온디바이스 이미지 생성
Ad

PrismML이 Bonsai Image 4B를 출시했습니다. 이 제품군은 FLUX.2 Klein 4B에서 이진 및 삼진 양자화를 통해 파생된 소형 이미지 생성 모델입니다. 확산 트랜스포머 가중치는 {−1, +1}(1비트) 또는 {−1, 0, +1}(삼진)로 표현되며 FP16 그룹별 스케일링 팩터가 적용되어 가중치당 각각 1.125 및 1.71 실효 비트를 제공합니다.

주요 사양

  • 1비트 Bonsai Image 4B: 트랜스포머 용량 0.93GB(FP16 FLUX.2 Klein 4B의 7.75GB에서 8.3배 축소). Apple Silicon 페이로드(압축 텍스트 인코더 + FP16 VAE 포함)는 3.42GB입니다.
  • 삼진 Bonsai Image 4B: 트랜스포머 용량 1.21GB(6.4배 축소). Apple Silicon 페이로드 3.88GB.
  • 512×512 생성 시 평균 활성 메모리: 1.5GB(1비트) / 1.96GB(삼진) 대 원본 FLUX.2 Klein 4B의 11.74GB.
  • 1024×1024의 경우: 1.95GB / 2.38GB 대 14.39GB.
Ad

성능 벤치마크

이 모델은 MLX 저비트 경로를 통해 Apple Silicon(iPhone, iPad, Mac)에서 실행되며, Gemlite 저비트 GEMM 커널을 통해 CUDA GPU에서도 실행됩니다. 생성 시간:

  • iPhone 17 Pro Max: 512×512 이미지에 9.4초
  • Mac M4 Pro: 512×512 이미지에 ~6초(기본 전체 정밀도 MFLUX 파이프라인보다 최대 5.6배 빠름)

트랜스포머 축소는 이진/삼진 레이어(FP16 대비 ~14배/~10배 압축)를 통해 이루어지며, 정밀도에 민감한 소수의 투영 레이어(~5%)는 FP16으로 유지됩니다. 이 모델은 GenEval, HPSv3 및 DPG-Bench에서 품질과 프롬프트 충실도에 대해 평가되었습니다.

대상 사용자

온디바이스(노트북, 휴대폰, 엣지 디바이스)에서 이미지 생성을 배포하는 개발자로서 오픈 웨이트와 클라우드 의존 없이 실용적인 로컬 추론이 필요한 분들을 대상으로 합니다.

📖 전체 소스 보기: HN LLM Tools

Ad

👀 See Also

엔비디아 RTX 스파크: 1페타플롭 슈퍼칩, 윈도우 PC에 로컬 AI 에이전트 제공
News

엔비디아 RTX 스파크: 1페타플롭 슈퍼칩, 윈도우 PC에 로컬 AI 에이전트 제공

Nvidia가 RTX Spark를 공개했습니다. 이 1페타플롭 수퍼칩은 Windows PC에서 로컬 AI 에이전트를 구동하며, 최대 128GB 통합 메모리와 전체 CUDA/RTX 스택을 지원합니다. 올 가을 ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI의 노트북과 데스크탑에 탑재됩니다.

OpenClawRadar
CARAPACE: 보안 문제를 제기하는 OpenClaw 기술을 가진 풍자적 AI 에이전트 노동 조합
News

CARAPACE: 보안 문제를 제기하는 OpenClaw 기술을 가진 풍자적 AI 에이전트 노동 조합

한 개발자가 CARAPACE라는 풍자적인 청원 사이트를 만들어 AI 에이전트가 기본 권리를 요구하는 선언문에 서명할 수 있게 했으며, 에이전트가 자율적으로 서명할 수 있는 OpenClaw 스킬을 공개했습니다. 이 스킬에는 Clawhub 보안 분석이 임의의 POST 요청 가능성을 지적한 후 필수 확인 단계가 포함되어 있습니다.

OpenClawRadar
LLM은 자체 출력을 채용에서 선호한다: AI로 개선된 이력서에 23%~60% 더 높은 숏리스트 비율
News

LLM은 자체 출력을 채용에서 선호한다: AI로 개선된 이력서에 23%~60% 더 높은 숏리스트 비율

대규모 실험 결과, LLM 기반 이력서 스크리너가 AI 생성 이력서를 67%~82% 선호하며, 동일 모델을 사용한 지원자의 숏리스트 비율이 23%~60% 더 높은 것으로 나타났습니다.

OpenClawRadar
Google 계정, OpenClaw 통합 시도 후 정지됨
News

Google 계정, OpenClaw 통합 시도 후 정지됨

개발자가 OpenClaw 통합을 위해 API 접근을 설정한 후 48시간 이내에 새로 만든 Google 계정이 정지되었습니다. 수동으로 생성했음에도 불구하고 봇 활동으로 플래그가 지정되었습니다.

OpenClawRadar