LM Studio Plugins: Web Image Analysis for Vision LLMs

Un desarrollador ha creado complementos para LM Studio que permiten a los LLM con capacidades visuales obtener imágenes de la web y analizarlas directamente dentro de la aplicación. Los complementos funcionan sin requerir MCP/APIs ni registro, utilizando scripts simples que se pueden instalar con un clic desde el sitio web de LM Studio.

Características Principales

El complemento principal, "analyze-images", permite a los LLM:

Obtener imágenes de la web para su análisis
Encadenar herramientas automáticamente según la tarea
Convertir las imágenes obtenidas en archivos de miniaturas más pequeños para incrustar en el chat y evitar desorden
Utilizar imágenes de resolución completa para el análisis cuando sea posible
Incrustar imágenes en las respuestas o usar galerías en tablas markdown cuando los usuarios soliciten múltiples imágenes

El desarrollador también actualizó complementos existentes:

El complemento Duck-Duck-Go ahora funciona con imágenes
El complemento Visitar Sitio Web ahora funciona con imágenes

Requisitos y Configuración

Para usar estos complementos, necesitas:

Un modelo con capacidades visuales (se recomiendan Qwen 3.5 9b o 27b)
LM Studio con soporte para complementos

El desarrollador compartió configuraciones específicas de Qwen 3.5 que funcionaron bien:

Temperatura: 1
Muestreo Top K: 20
Penalización de Repetición: 1
Penalización de Presencia: 1.9
Muestreo Top P: 0.95
Muestreo Min P: 0

Señaló que la configuración de Penalización de Presencia en 1.9 ayudó a solucionar problemas de repetición y evitar bucles.

El mensaje del sistema utilizado fue: "Eres un asistente capaz, reflexivo y preciso. Prioriza siempre ser veraz, matizado, perspicaz y eficiente, adaptando tus respuestas específicamente a las necesidades y preferencias del usuario. Investiga antes de responder las preguntas: utiliza tanto el razonamiento como las llamadas a herramientas para sintetizar una conclusión adecuada."

Enlaces de Complementos

Complemento Analizar Imágenes: https://lmstudio.ai/vadimfedenko/analyze-images
Duck-Duck-Go reworkeado: https://lmstudio.ai/vadimfedenko/duck-duck-go-reworked
Visitar Sitio Web reworkeado: https://lmstudio.ai/vadimfedenko/visit-website-reworked

El desarrollador también compartió una Plantilla de Mensaje Jinja en Pastebin que ayudó a solucionar errores en las llamadas a herramientas.

📖 Leer la fuente completa: r/LocalLLaMA

Los complementos de LM Studio añaden análisis de imágenes web para LLMs con capacidades visuales.

Características Principales

Requisitos y Configuración

Enlaces de Complementos

👀 Ver también

agentcache: Biblioteca de Python para Caché de Prefijos de LLM Multi-Agente

El Protocolo AVP Permite que los Agentes LLM Compartan la Caché KV en Lugar de Texto para Mayor Eficiencia de Tokens

obsidian-mcp: Servidor MCP consciente del grafo para Claude con 25 herramientas orientadas a bóvedas grandes

Vibeyard: Panel de código abierto que inicia sesiones de Claude desde PRs, Issues y tarjetas Kanban