Lokales KI-Bildkritik-Tool nutzt Ollama Vision-Modelle für Feedback

Ein Entwickler hat eine kostenlose Desktop-Anwendung veröffentlicht, die KI-Bildkritik mit lokalen Vision-Modellen über Ollama bietet. Das Tool analysiert KI-generierte Bilder und erstellt strukturierte Feedback-Berichte, ohne Cloud-Dienste zu benötigen.
Hauptfunktionen
- Läuft zu 100 % lokal mit Ollama-Vision-Modellen
- Verwendet standardmäßig llama3.2-vision, kann aber auf andere Vision-Modelle umgestellt werden
- Erstellt übersichtliche Berichte mit spezifischen Abschnitten
- Funktioniert sowohl mit Flux/SD3 Anime-Stil-Generierungen als auch mit fotorealistischen Bildern
Berichtsstruktur
- Was gut aussieht - Positive Aspekte des Bildes
- Was verbessert werden könnte - Bereiche, die Verbesserung benötigen
- Schnellbewertungen - Bewertungen für Anatomie, Farbharmonie und Stimmung
- Gesamtbewertung - Mit Begründung für die Einschätzung
- Prompt-Optimierungsvorschlag - Spezifische Formulierungen, die zu Prompts hinzugefügt werden können, um bessere nächste Generationen zu erhalten
Anforderungen
Das Tool erfordert, dass Ollama bereits installiert ist und ein Vision-Modell geladen wurde. Der Entwickler weist darauf hin, dass dieses Tool nicht für Sie geeignet ist, wenn Sie Ollama nicht eingerichtet haben.
Aktueller Status und Feedback-Anfrage
Der Entwickler hat Screenshots der Anwendungsoberfläche und zwei Beispielanalysen geteilt. Er sucht Feedback von Nutzern, die tatsächlich mit Vision-Modellen arbeiten, und fragt, welche zusätzlichen Funktionen nützlich wären. Genannte mögliche Verbesserungen umfassen mehr Bewertungskategorien, Stapelverarbeitungsfähigkeiten und verschiedene Fokusoptionen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Engramx v3.4: MCP Server + SQLite Wissensgraph reduziert Tokenverbrauch von Claude Code um 89%
Engramx v3.4 fängt Dateilesevorgänge für Claude Code-Agenten ab und gibt strukturelle Zusammenfassungen statt Rohinhalten zurück. Benchmarks zeigen eine aggregierte Token-Reduktion von 89,1 % in einer Codebasis mit 87 Dateien.

OpenClaw Memos Plugin behebt Speicherübergabeprobleme in KI-Codierungsagenten
Ein Reddit-Nutzer teilt mit, wie der Claude-Code-Leck Probleme mit dem Speicherübergang bei KI-Codierungsagenten aufzeigte, bei denen aufgeblähte Transkripte während des Modellwechsels Probleme verursachen. Sie implementierten das Memos-Plugin in OpenClaw mit einer selektiven Abrufstrategie, um kürzliche Arbeiten zu komprimieren und veraltete Tool-Aufrufe zu entfernen.

OpenBridge: Kostenlose Open-Source-Fernsteuerung für Claude Code via Slack/Discord
OpenBridge ist ein kostenloses, quelloffenes Tool, mit dem Sie Claude Code über Slack oder Discord steuern können, wobei Projekte als Kanäle und Konversationen als Threads organisiert werden. Es läuft lokal oder auf einem VPS und funktioniert mit bestehenden Claude Code/Codex-Abonnements ohne zusätzliche API-Gebühren.

OpenClaw Skill Server für Indische Marktanalyse und Handel
Ein Open-Source-Handelsterminal für den indischen Markt wurde als OpenClaw-Skill-Server integriert, sodass Agenten Marktdaten abrufen und Multi-Agenten-Analysen über HTTP durchführen können. Das System bietet strukturierte Handelspläne mit Einstiegspreisen, Stop-Loss-Orders und Zielen für drei Risikoprofile.