로컬 AI 이미지 비평 도구: Ollama 비전 모델로 피드백 받기

한 개발자가 Ollama를 통해 로컬 비전 모델을 사용해 AI 이미지 비평을 제공하는 무료 데스크톱 애플리케이션을 출시했습니다. 이 도구는 클라우드 서비스가 필요 없이 AI 생성 이미지를 분석하고 구조화된 피드백 보고서를 생성합니다.

주요 기능

Ollama 비전 모델을 사용해 100% 로컬에서 실행
기본적으로 llama3.2-vision을 사용하지만 다른 비전 모델로 전환 가능
구체적인 섹션으로 구성된 깔끔한 보고서 생성
Flux/SD3 애니메이션 스타일 생성물과 사실적인 이미지 모두 작동

보고서 구조

잘된 점 - 이미지의 긍정적인 측면
개선이 필요한 부분 - 향상이 필요한 영역
빠른 점수 - 해부학, 색조 조화, 분위기에 대한 평가
전체 평가 - 평가 근거와 함께
프롬프트 업그레이드 제안 - 다음 생성물을 개선하기 위해 프롬프트에 추가할 구체적인 문구

요구사항

이 도구는 Ollama가 이미 설치되어 있고 비전 모델이 풀(pull)된 상태여야 합니다. 개발자는 Ollama가 설정되지 않은 경우 이 도구가 적합하지 않다고 언급했습니다.

현재 상태 및 피드백 요청

개발자는 애플리케이션 인터페이스와 두 가지 예시 분석의 스크린샷을 공유했습니다. 그들은 실제로 비전 모델을 사용하는 사용자들로부터 피드백을 구하고 있으며, 어떤 추가 기능이 유용할지 묻고 있습니다. 언급된 잠재적 개선사항으로는 더 많은 점수 범주, 일괄 처리 기능, 다양한 초점 옵션이 포함됩니다.

📖 Read the full source: r/LocalLLaMA