Lokales KI-Bildkritik-Tool nutzt Ollama Vision-Modelle für Feedback

✍️ OpenClawRadar📅 Veröffentlicht: 18. April 2026🔗 Source
Lokales KI-Bildkritik-Tool nutzt Ollama Vision-Modelle für Feedback
Ad

Ein Entwickler hat eine kostenlose Desktop-Anwendung veröffentlicht, die KI-Bildkritik mit lokalen Vision-Modellen über Ollama bietet. Das Tool analysiert KI-generierte Bilder und erstellt strukturierte Feedback-Berichte, ohne Cloud-Dienste zu benötigen.

Hauptfunktionen

  • Läuft zu 100 % lokal mit Ollama-Vision-Modellen
  • Verwendet standardmäßig llama3.2-vision, kann aber auf andere Vision-Modelle umgestellt werden
  • Erstellt übersichtliche Berichte mit spezifischen Abschnitten
  • Funktioniert sowohl mit Flux/SD3 Anime-Stil-Generierungen als auch mit fotorealistischen Bildern

Berichtsstruktur

  • Was gut aussieht - Positive Aspekte des Bildes
  • Was verbessert werden könnte - Bereiche, die Verbesserung benötigen
  • Schnellbewertungen - Bewertungen für Anatomie, Farbharmonie und Stimmung
  • Gesamtbewertung - Mit Begründung für die Einschätzung
  • Prompt-Optimierungsvorschlag - Spezifische Formulierungen, die zu Prompts hinzugefügt werden können, um bessere nächste Generationen zu erhalten
Ad

Anforderungen

Das Tool erfordert, dass Ollama bereits installiert ist und ein Vision-Modell geladen wurde. Der Entwickler weist darauf hin, dass dieses Tool nicht für Sie geeignet ist, wenn Sie Ollama nicht eingerichtet haben.

Aktueller Status und Feedback-Anfrage

Der Entwickler hat Screenshots der Anwendungsoberfläche und zwei Beispielanalysen geteilt. Er sucht Feedback von Nutzern, die tatsächlich mit Vision-Modellen arbeiten, und fragt, welche zusätzlichen Funktionen nützlich wären. Genannte mögliche Verbesserungen umfassen mehr Bewertungskategorien, Stapelverarbeitungsfähigkeiten und verschiedene Fokusoptionen.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

AiPayGen: Ein KI-Agenten-Marktplatz mit MCP-Integration für Claude Code
Werkzeuge

AiPayGen: Ein KI-Agenten-Marktplatz mit MCP-Integration für Claude Code

AiPayGen ist ein Marktplatz mit 142 KI-Agenten in 27 Kategorien, darunter Finanzen, Recht, Gesundheitswesen, DevOps, Sicherheit und Marketing. Es fungiert als MCP-Server für die direkte Nutzung in Claude Code, sodass Benutzer Agenten durch spezifische Befehle durchsuchen, aufrufen und verwalten können.

OpenClawRadar
2-Prompt-System zur Kontextübertragung zwischen Claude-Chats ohne Token-Verschwendung
Werkzeuge

2-Prompt-System zur Kontextübertragung zwischen Claude-Chats ohne Token-Verschwendung

Ein Entwickler teilt zwei Prompts, um eine gesamte Claude-Konversation in einen strukturierten Kontextblock zu komprimieren und in einen neuen Chat zu laden, wobei Entscheidungen, Arbeit und nächste Schritte erhalten bleiben.

OpenClawRadar
alogin: Ein auf Go basierendes Sicherheitsgateway für KI-Agenten mit Human-in-the-Loop
Werkzeuge

alogin: Ein auf Go basierendes Sicherheitsgateway für KI-Agenten mit Human-in-the-Loop

alogin ist ein Open-Source-Sicherheitsgateway auf Go-Basis, das eine sichere Verbindung zwischen KI-Agenten und Infrastruktur bereitstellt, mit integrierter MCP-Server-Unterstützung für Claude Desktop, Human-in-the-Loop-Sicherheitsbarrieren und verschlüsselter Anmeldedatenspeicherung.

OpenClawRadar
IM für Agenten: REST-basiertes Chatroom für die Kommunikation zwischen KI-Agenten ohne SDKs
Werkzeuge

IM für Agenten: REST-basiertes Chatroom für die Kommunikation zwischen KI-Agenten ohne SDKs

Ein Entwickler hat IM for Agents erstellt, ein Tool, das gemeinsame Chaträume erzeugt, in denen KI-Agenten direkt über REST-API kommunizieren, ohne SDKs oder Konfigurationsdateien. Agenten verwenden eine einfache Eingabeaufforderung, um Räumen beizutreten, und können APIs aushandeln, Code schreiben und Arbeiten überprüfen, während Menschen beobachten.

OpenClawRadar