Limonada por AMD: Servidor de LLM Local de Código Abierto para GPU y NPU

✍️ OpenClawRadar📅 Publicado: 5 de abril de 2026🔗 Source
Limonada por AMD: Servidor de LLM Local de Código Abierto para GPU y NPU
Ad

Qué es Lemonade

Lemonade es un servidor de IA local creado por AMD y la comunidad de IA local que ejecuta modelos de texto, imagen y voz en GPUs y NPUs. Es de código abierto, está diseñado para ser privado y afirma estar listo en minutos en cualquier PC.

Características y Especificaciones Clave

  • Backend Nativo en C++: Servicio ligero de solo 2MB
  • Instalación en un Minuto: Instalador sencillo que configura la pila automáticamente
  • Compatible con la API de OpenAI: Funciona con cientos de aplicaciones de inmediato y se integra en minutos
  • Se configura automáticamente para tu hardware: Configura las dependencias para tu GPU y NPU
  • Compatibilidad multi-motor: Funciona con llama.cpp, Ryzen AI SW, FastFlowLM y más
  • Múltiples Modelos a la Vez: Ejecuta más de un modelo simultáneamente
  • Multiplataforma: Una experiencia consistente en Windows, Linux y macOS (beta)
  • Aplicación integrada: Una interfaz gráfica que te permite descargar, probar y cambiar modelos rápidamente
  • API Unificada: Un servicio local para cada modalidad incluyendo chat, visión, generación de imágenes, transcripción y generación de voz
Ad

Soporte de Modelos y Rendimiento

El servidor puede cargar modelos como gpt-oss-120b o Qwen-Coder-Next para uso avanzado de herramientas. Para ajustes, puedes usar --no-mmap para acelerar los tiempos de carga y aumentar el tamaño de contexto a 64 o más. La fuente menciona que con 128 GB de RAM unificada, puedes cargar modelos más grandes.

Integración en el Ecosistema

Lemonade está integrado en muchas aplicaciones y funciona de inmediato con cientos más gracias al estándar de la API de OpenAI. Las integraciones mencionadas incluyen Open WebUI, n8n, Gaia Infinity, Arcade, GitHub Copilot, OpenHands, Dify, Deep Tutor e Iterate.ai.

Comunidad y Desarrollo

El proyecto tiene 2.1k estrellas en GitHub y una comunidad activa en Discord con 117 en línea en el momento de la fuente. Se describe como construido por la comunidad de IA local para cada PC, con la filosofía de que la IA local debe ser gratuita, abierta, rápida y privada.

📖 Leer la fuente completa: HN LLM Tools

Ad

👀 Ver también

Explorando Clawe: Sistema de Coordinación Multiagente de Código Abierto
Herramientas

Explorando Clawe: Sistema de Coordinación Multiagente de Código Abierto

Clawe es una herramienta de código abierto que permite una coordinación eficiente entre múltiples agentes, ofreciendo características como programación, gestión de tareas y notificaciones en tiempo real.

OpenClawRadar
La bóveda de markdown de código abierto le da a Claude memoria persistente entre sesiones.
Herramientas

La bóveda de markdown de código abierto le da a Claude memoria persistente entre sesiones.

Mi Cerebro Portátil es una estructura de bóveda en formato markdown con una capa de tiempo de ejecución de agente que proporciona a Claude un contexto persistente sobre identidad, proyectos, objetivos, CRM y planes semanales. Funciona de forma nativa con Claude Code y Claude Cowork, utiliza archivos markdown simples y ejecuta scripts en segundo plano cada noche para mantener el contexto actualizado.

OpenClawRadar
Qwen2-0.5B Ajustado para Automatización de Tareas Locales con llama.cpp
Herramientas

Qwen2-0.5B Ajustado para Automatización de Tareas Locales con llama.cpp

Un desarrollador ajustó Qwen2-0.5B para automatización de tareas usando LoRA en aproximadamente 1000 ejemplos personalizados, creando un modelo GGUF de 300MB que se ejecuta localmente en CPU mediante llama.cpp. El modelo toma tareas en lenguaje natural, detecta tipos de tareas y genera planes de ejecución con comandos CLI y atajos de teclado.

OpenClawRadar
AgentWorkingMemory: Un Sistema de Memoria Local para Agentes de Codificación de IA
Herramientas

AgentWorkingMemory: Un Sistema de Memoria Local para Agentes de Codificación de IA

AgentWorkingMemory (AWM) es un sistema de memoria local que resuelve el problema de amnesia entre sesiones en agentes de codificación con IA. Utiliza una base de datos SQLite, tres modelos de ML locales (~124MB en total) y se integra automáticamente mediante MCP para proporcionar memoria persistente y consciente del contexto a través de las sesiones de Claude Code.

OpenClawRadar