Los complementos de LM Studio añaden análisis de imágenes web para LLMs con capacidades visuales.

✍️ OpenClawRadar📅 Publicado: 31 de marzo de 2026🔗 Source
Los complementos de LM Studio añaden análisis de imágenes web para LLMs con capacidades visuales.
Ad

Un desarrollador ha creado complementos para LM Studio que permiten a los LLM con capacidades visuales obtener imágenes de la web y analizarlas directamente dentro de la aplicación. Los complementos funcionan sin requerir MCP/APIs ni registro, utilizando scripts simples que se pueden instalar con un clic desde el sitio web de LM Studio.

Características Principales

El complemento principal, "analyze-images", permite a los LLM:

  • Obtener imágenes de la web para su análisis
  • Encadenar herramientas automáticamente según la tarea
  • Convertir las imágenes obtenidas en archivos de miniaturas más pequeños para incrustar en el chat y evitar desorden
  • Utilizar imágenes de resolución completa para el análisis cuando sea posible
  • Incrustar imágenes en las respuestas o usar galerías en tablas markdown cuando los usuarios soliciten múltiples imágenes

El desarrollador también actualizó complementos existentes:

  • El complemento Duck-Duck-Go ahora funciona con imágenes
  • El complemento Visitar Sitio Web ahora funciona con imágenes
Ad

Requisitos y Configuración

Para usar estos complementos, necesitas:

  • Un modelo con capacidades visuales (se recomiendan Qwen 3.5 9b o 27b)
  • LM Studio con soporte para complementos

El desarrollador compartió configuraciones específicas de Qwen 3.5 que funcionaron bien:

Temperatura: 1
Muestreo Top K: 20
Penalización de Repetición: 1
Penalización de Presencia: 1.9
Muestreo Top P: 0.95
Muestreo Min P: 0

Señaló que la configuración de Penalización de Presencia en 1.9 ayudó a solucionar problemas de repetición y evitar bucles.

El mensaje del sistema utilizado fue: "Eres un asistente capaz, reflexivo y preciso. Prioriza siempre ser veraz, matizado, perspicaz y eficiente, adaptando tus respuestas específicamente a las necesidades y preferencias del usuario. Investiga antes de responder las preguntas: utiliza tanto el razonamiento como las llamadas a herramientas para sintetizar una conclusión adecuada."

Enlaces de Complementos

  • Complemento Analizar Imágenes: https://lmstudio.ai/vadimfedenko/analyze-images
  • Duck-Duck-Go reworkeado: https://lmstudio.ai/vadimfedenko/duck-duck-go-reworked
  • Visitar Sitio Web reworkeado: https://lmstudio.ai/vadimfedenko/visit-website-reworked

El desarrollador también compartió una Plantilla de Mensaje Jinja en Pastebin que ayudó a solucionar errores en las llamadas a herramientas.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Visualizador en línea: Los modelos de IA locales ahora pueden renderizar visualizaciones HTML interactivas.
Herramientas

Visualizador en línea: Los modelos de IA locales ahora pueden renderizar visualizaciones HTML interactivas.

Inline Visualizer es un complemento con licencia BSD-3 para Open WebUI que permite a cualquier modelo de IA local con soporte para llamadas a herramientas renderizar visualizaciones HTML/SVG interactivas directamente en el chat, con un puente JavaScript que permite a los elementos enviar mensajes de vuelta a la IA.

OpenClawRadar
Rift CLI: Administra Git Worktrees para Flujos de Trabajo Paralelos de Agentes de IA
Herramientas

Rift CLI: Administra Git Worktrees para Flujos de Trabajo Paralelos de Agentes de IA

Rift es una herramienta CLI que crea árboles de trabajo Git aislados y ramas para ejecutar múltiples agentes de codificación de IA como Claude Code simultáneamente en el mismo repositorio. Incluye ganchos de ciclo de vida, mapeo de puertos determinista y soporte para espacios de trabajo multi-editor.

OpenClawRadar
El Agente ClawsifyAI Maneja Tareas de Correo Electrónico, Investigación y Lluvia de Ideas
Herramientas

El Agente ClawsifyAI Maneja Tareas de Correo Electrónico, Investigación y Lluvia de Ideas

Un desarrollador probó ClawsifyAI, un bot tipo garra con estilo de agente de IA, durante una semana y descubrió que manejaba correos electrónicos, investigación, trabajo repetitivo y lluvia de ideas. El agente proporciona retroalimentación clara, soluciones prácticas y, a veces, mejores ideas de las planeadas originalmente.

OpenClawRadar
Corrección de Fuga de Memoria de Claude Code para Homelabs Linux
Herramientas

Corrección de Fuga de Memoria de Claude Code para Homelabs Linux

Un desarrollador descubrió que Claude Code tiene una grave fuga de memoria en glibc malloc que consumió 400GB de RAM y colapsó su homelab Proxmox, luego creó una solución de protección de dos niveles con un shim LD_PRELOAD y un watchdog.

OpenClawRadar