Lokales KI-Bildkritik-Tool nutzt Ollama Vision-Modelle für Feedback

Ein Entwickler hat eine kostenlose Desktop-Anwendung veröffentlicht, die KI-Bildkritik mit lokalen Vision-Modellen über Ollama bietet. Das Tool analysiert KI-generierte Bilder und erstellt strukturierte Feedback-Berichte, ohne Cloud-Dienste zu benötigen.
Hauptfunktionen
- Läuft zu 100 % lokal mit Ollama-Vision-Modellen
- Verwendet standardmäßig llama3.2-vision, kann aber auf andere Vision-Modelle umgestellt werden
- Erstellt übersichtliche Berichte mit spezifischen Abschnitten
- Funktioniert sowohl mit Flux/SD3 Anime-Stil-Generierungen als auch mit fotorealistischen Bildern
Berichtsstruktur
- Was gut aussieht - Positive Aspekte des Bildes
- Was verbessert werden könnte - Bereiche, die Verbesserung benötigen
- Schnellbewertungen - Bewertungen für Anatomie, Farbharmonie und Stimmung
- Gesamtbewertung - Mit Begründung für die Einschätzung
- Prompt-Optimierungsvorschlag - Spezifische Formulierungen, die zu Prompts hinzugefügt werden können, um bessere nächste Generationen zu erhalten
Anforderungen
Das Tool erfordert, dass Ollama bereits installiert ist und ein Vision-Modell geladen wurde. Der Entwickler weist darauf hin, dass dieses Tool nicht für Sie geeignet ist, wenn Sie Ollama nicht eingerichtet haben.
Aktueller Status und Feedback-Anfrage
Der Entwickler hat Screenshots der Anwendungsoberfläche und zwei Beispielanalysen geteilt. Er sucht Feedback von Nutzern, die tatsächlich mit Vision-Modellen arbeiten, und fragt, welche zusätzlichen Funktionen nützlich wären. Genannte mögliche Verbesserungen umfassen mehr Bewertungskategorien, Stapelverarbeitungsfähigkeiten und verschiedene Fokusoptionen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

AiPayGen: Ein KI-Agenten-Marktplatz mit MCP-Integration für Claude Code
AiPayGen ist ein Marktplatz mit 142 KI-Agenten in 27 Kategorien, darunter Finanzen, Recht, Gesundheitswesen, DevOps, Sicherheit und Marketing. Es fungiert als MCP-Server für die direkte Nutzung in Claude Code, sodass Benutzer Agenten durch spezifische Befehle durchsuchen, aufrufen und verwalten können.

2-Prompt-System zur Kontextübertragung zwischen Claude-Chats ohne Token-Verschwendung
Ein Entwickler teilt zwei Prompts, um eine gesamte Claude-Konversation in einen strukturierten Kontextblock zu komprimieren und in einen neuen Chat zu laden, wobei Entscheidungen, Arbeit und nächste Schritte erhalten bleiben.

alogin: Ein auf Go basierendes Sicherheitsgateway für KI-Agenten mit Human-in-the-Loop
alogin ist ein Open-Source-Sicherheitsgateway auf Go-Basis, das eine sichere Verbindung zwischen KI-Agenten und Infrastruktur bereitstellt, mit integrierter MCP-Server-Unterstützung für Claude Desktop, Human-in-the-Loop-Sicherheitsbarrieren und verschlüsselter Anmeldedatenspeicherung.

IM für Agenten: REST-basiertes Chatroom für die Kommunikation zwischen KI-Agenten ohne SDKs
Ein Entwickler hat IM for Agents erstellt, ein Tool, das gemeinsame Chaträume erzeugt, in denen KI-Agenten direkt über REST-API kommunizieren, ohne SDKs oder Konfigurationsdateien. Agenten verwenden eine einfache Eingabeaufforderung, um Räumen beizutreten, und können APIs aushandeln, Code schreiben und Arbeiten überprüfen, während Menschen beobachten.