Limonada por AMD: Servidor de LLM Local de Código Abierto para GPU y NPU

✍️ OpenClawRadar📅 Publicado: 5 de abril de 2026🔗 Source

Qué es Lemonade

Lemonade es un servidor de IA local creado por AMD y la comunidad de IA local que ejecuta modelos de texto, imagen y voz en GPUs y NPUs. Es de código abierto, está diseñado para ser privado y afirma estar listo en minutos en cualquier PC.

Características y Especificaciones Clave

Backend Nativo en C++: Servicio ligero de solo 2MB
Instalación en un Minuto: Instalador sencillo que configura la pila automáticamente
Compatible con la API de OpenAI: Funciona con cientos de aplicaciones de inmediato y se integra en minutos
Se configura automáticamente para tu hardware: Configura las dependencias para tu GPU y NPU
Compatibilidad multi-motor: Funciona con llama.cpp, Ryzen AI SW, FastFlowLM y más
Múltiples Modelos a la Vez: Ejecuta más de un modelo simultáneamente
Multiplataforma: Una experiencia consistente en Windows, Linux y macOS (beta)
Aplicación integrada: Una interfaz gráfica que te permite descargar, probar y cambiar modelos rápidamente
API Unificada: Un servicio local para cada modalidad incluyendo chat, visión, generación de imágenes, transcripción y generación de voz

Soporte de Modelos y Rendimiento

El servidor puede cargar modelos como gpt-oss-120b o Qwen-Coder-Next para uso avanzado de herramientas. Para ajustes, puedes usar --no-mmap para acelerar los tiempos de carga y aumentar el tamaño de contexto a 64 o más. La fuente menciona que con 128 GB de RAM unificada, puedes cargar modelos más grandes.

Integración en el Ecosistema

Lemonade está integrado en muchas aplicaciones y funciona de inmediato con cientos más gracias al estándar de la API de OpenAI. Las integraciones mencionadas incluyen Open WebUI, n8n, Gaia Infinity, Arcade, GitHub Copilot, OpenHands, Dify, Deep Tutor e Iterate.ai.

Comunidad y Desarrollo

El proyecto tiene 2.1k estrellas en GitHub y una comunidad activa en Discord con 117 en línea en el momento de la fuente. Se describe como construido por la comunidad de IA local para cada PC, con la filosofía de que la IA local debe ser gratuita, abierta, rápida y privada.

📖 Leer la fuente completa: HN LLM Tools

👀 Ver también

Herramientas

Octopoda: Capa de Memoria de Código Abierto para Agentes de IA Locales

Octopoda es una capa de memoria de código abierto que proporciona a los agentes de IA locales memoria persistente entre sesiones, búsqueda semántica, detección de bucles y recuperación de fallos. Funciona completamente sin conexión con un modelo de incrustación de 33 MB y se integra con LangChain, CrewAI, AutoGen y OpenAI Agents SDK.

16 abr 2026, 10:45 UTC

OpenClawRadar

Herramientas

La habilidad Claude Code genera capturas de pantalla de la App Store utilizando la IA de Gemini.

Una nueva habilidad de Claude Code llamada /aso-cosmicmeta-ss crea capturas de pantalla para App Store y Google Play mediante un flujo de trabajo de 6 fases que analiza bases de código y utiliza la IA Gemini para mejoras. La habilidad incluye una puerta de aprobación para detectar problemas de diseño antes de usar créditos de API.

20 abr 2026, 13:45 UTC

OpenClawRadar

Herramientas

Código abierto local cambia automáticamente entre modelos de Claude para reducir costos de IA.

Un desarrollador creó un gancho local para Cursor y Claude Code que analiza las indicaciones y selecciona automáticamente el modelo Claude apropiado (Haiku, Sonnet u Opus) antes de enviar las solicitudes. La herramienta utiliza reglas de palabras clave para clasificar tareas y bloquear escenarios de sobrepago, mostrando un análisis retrospectivo una reducción de costos del 50-70%.

7 mar 2026, 16:45 UTC

OpenClawRadar

Herramientas

Vibeyard añade tablero Kanban para gestionar múltiples sesiones de Claude Code

Un IDE de código abierto llamado Vibeyard ahora incluye un tablero Kanban que permite iniciar sesiones del agente Claude Code directamente desde las tarjetas. Las tarjetas se mueven automáticamente a Hecho cuando el agente termina.

29 abr 2026, 00:18 UTC

OpenClawRadar