Los complementos de LM Studio añaden análisis de imágenes web para LLMs con capacidades visuales.

Un desarrollador ha creado complementos para LM Studio que permiten a los LLM con capacidades visuales obtener imágenes de la web y analizarlas directamente dentro de la aplicación. Los complementos funcionan sin requerir MCP/APIs ni registro, utilizando scripts simples que se pueden instalar con un clic desde el sitio web de LM Studio.
Características Principales
El complemento principal, "analyze-images", permite a los LLM:
- Obtener imágenes de la web para su análisis
- Encadenar herramientas automáticamente según la tarea
- Convertir las imágenes obtenidas en archivos de miniaturas más pequeños para incrustar en el chat y evitar desorden
- Utilizar imágenes de resolución completa para el análisis cuando sea posible
- Incrustar imágenes en las respuestas o usar galerías en tablas markdown cuando los usuarios soliciten múltiples imágenes
El desarrollador también actualizó complementos existentes:
- El complemento Duck-Duck-Go ahora funciona con imágenes
- El complemento Visitar Sitio Web ahora funciona con imágenes
Requisitos y Configuración
Para usar estos complementos, necesitas:
- Un modelo con capacidades visuales (se recomiendan Qwen 3.5 9b o 27b)
- LM Studio con soporte para complementos
El desarrollador compartió configuraciones específicas de Qwen 3.5 que funcionaron bien:
Temperatura: 1 Muestreo Top K: 20 Penalización de Repetición: 1 Penalización de Presencia: 1.9 Muestreo Top P: 0.95 Muestreo Min P: 0
Señaló que la configuración de Penalización de Presencia en 1.9 ayudó a solucionar problemas de repetición y evitar bucles.
El mensaje del sistema utilizado fue: "Eres un asistente capaz, reflexivo y preciso. Prioriza siempre ser veraz, matizado, perspicaz y eficiente, adaptando tus respuestas específicamente a las necesidades y preferencias del usuario. Investiga antes de responder las preguntas: utiliza tanto el razonamiento como las llamadas a herramientas para sintetizar una conclusión adecuada."
Enlaces de Complementos
- Complemento Analizar Imágenes: https://lmstudio.ai/vadimfedenko/analyze-images
- Duck-Duck-Go reworkeado: https://lmstudio.ai/vadimfedenko/duck-duck-go-reworked
- Visitar Sitio Web reworkeado: https://lmstudio.ai/vadimfedenko/visit-website-reworked
El desarrollador también compartió una Plantilla de Mensaje Jinja en Pastebin que ayudó a solucionar errores en las llamadas a herramientas.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Visualizador en línea: Los modelos de IA locales ahora pueden renderizar visualizaciones HTML interactivas.
Inline Visualizer es un complemento con licencia BSD-3 para Open WebUI que permite a cualquier modelo de IA local con soporte para llamadas a herramientas renderizar visualizaciones HTML/SVG interactivas directamente en el chat, con un puente JavaScript que permite a los elementos enviar mensajes de vuelta a la IA.

Rift CLI: Administra Git Worktrees para Flujos de Trabajo Paralelos de Agentes de IA
Rift es una herramienta CLI que crea árboles de trabajo Git aislados y ramas para ejecutar múltiples agentes de codificación de IA como Claude Code simultáneamente en el mismo repositorio. Incluye ganchos de ciclo de vida, mapeo de puertos determinista y soporte para espacios de trabajo multi-editor.

El Agente ClawsifyAI Maneja Tareas de Correo Electrónico, Investigación y Lluvia de Ideas
Un desarrollador probó ClawsifyAI, un bot tipo garra con estilo de agente de IA, durante una semana y descubrió que manejaba correos electrónicos, investigación, trabajo repetitivo y lluvia de ideas. El agente proporciona retroalimentación clara, soluciones prácticas y, a veces, mejores ideas de las planeadas originalmente.

Corrección de Fuga de Memoria de Claude Code para Homelabs Linux
Un desarrollador descubrió que Claude Code tiene una grave fuga de memoria en glibc malloc que consumió 400GB de RAM y colapsó su homelab Proxmox, luego creó una solución de protección de dos niveles con un shim LD_PRELOAD y un watchdog.