Локальный ИИ-анализатор изображений: Ollama Vision для обратной связи

Разработчик выпустил бесплатное настольное приложение, которое предоставляет критический анализ изображений ИИ с использованием локальных моделей компьютерного зрения через Ollama. Инструмент анализирует сгенерированные ИИ изображения и создаёт структурированные отчёты с обратной связью без необходимости использования облачных сервисов.

Ключевые особенности

Работает на 100% локально с использованием моделей компьютерного зрения Ollama
По умолчанию использует llama3.2-vision, но можно переключиться на другие модели компьютерного зрения
Генерирует аккуратные отчёты с определёнными разделами
Работает как с аниме-стилем Flux/SD3, так и с фотореалистичными изображениями

Структура отчёта

Что выглядит отлично — положительные аспекты изображения
Что можно улучшить — области, требующие доработки
Быстрые оценки — рейтинги для Анатомии, Цветовой гармонии и Настроения
Общая оценка — с обоснованием оценки
Предложение по улучшению промпта — конкретные фразы для добавления в промпты для лучших следующих генераций

Требования

Для работы инструмента требуется уже установленный Ollama и загруженная модель компьютерного зрения. Разработчик отмечает, что если у вас не настроен Ollama, этот инструмент вам не подходит.

Текущий статус и запрос обратной связи

Разработчик поделился скриншотами интерфейса приложения и двумя примерами анализов. Он ищет обратную связь от пользователей, которые действительно работают с моделями компьютерного зрения, спрашивая, какие дополнительные функции были бы полезны. Среди возможных улучшений упоминаются больше категорий оценок, возможности пакетной обработки и различные варианты фокусировки.

📖 Read the full source: r/LocalLLaMA

Локальный инструмент для критики изображений с использованием моделей зрения Ollama для обратной связи

Ключевые особенности

Структура отчёта

Требования

Текущий статус и запрос обратной связи

👀 Смотрите также

Код Клода использовался для симуляции более 4000 игр в "Мафию" с использованием языковых моделей

Джан добавляет установку OpenClaw в один клик с интеграцией модели Jan-v3-Base.

Кула: Автономный мониторинг серверов Linux без зависимостей

Coding-Flashcards: 800+ карточек Anki для Rust, SQLite, Godot и Wolfram Language