Limonada por AMD: Servidor Local de LLM de Código Aberto para GPU e NPU

✍️ OpenClawRadar📅 Publicado: April 5, 2026🔗 Source
Limonada por AMD: Servidor Local de LLM de Código Aberto para GPU e NPU
Ad

O que é o Lemonade

Lemonade é um servidor de IA local desenvolvido pela AMD e pela comunidade de IA local que executa modelos de texto, imagem e fala em GPUs e NPUs. É de código aberto, projetado para ser privado e afirma estar pronto em minutos em qualquer PC.

Recursos e Especificações Principais

  • Backend Nativo em C++: Serviço leve que tem apenas 2MB
  • Instalação em Um Minuto: Instalador simples que configura a pilha automaticamente
  • Compatível com API da OpenAI: Funciona com centenas de aplicativos prontos para uso e integra em minutos
  • Configura-se automaticamente para seu hardware: Configura dependências para sua GPU e NPU
  • Compatibilidade com múltiplos mecanismos: Funciona com llama.cpp, Ryzen AI SW, FastFlowLM e mais
  • Múltiplos Modelos Simultaneamente: Execute mais de um modelo ao mesmo tempo
  • Multiplataforma: Uma experiência consistente no Windows, Linux e macOS (beta)
  • Aplicativo integrado: Uma interface gráfica que permite baixar, testar e alternar modelos rapidamente
  • API Unificada: Um serviço local para cada modalidade incluindo chat, visão, geração de imagens, transcrição e geração de fala
Ad

Suporte a Modelos e Desempenho

O servidor pode carregar modelos como gpt-oss-120b ou Qwen-Coder-Next para uso avançado de ferramentas. Para ajustes, você pode usar --no-mmap para acelerar os tempos de carregamento e aumentar o tamanho do contexto para 64 ou mais. A fonte menciona que com 128 GB de RAM unificada, você pode carregar modelos maiores.

Integração com o Ecossistema

Lemonade está integrado em muitos aplicativos e funciona prontamente com centenas de outros graças ao padrão da API da OpenAI. As integrações mencionadas incluem Open WebUI, n8n, Gaia Infinity, Arcade, GitHub Copilot, OpenHands, Dify, Deep Tutor e Iterate.ai.

Comunidade e Desenvolvimento

O projeto tem 2,1 mil estrelas no GitHub e uma comunidade ativa no Discord com 117 online no momento da fonte. É descrito como sendo construído pela comunidade de IA local para cada PC, com a filosofia de que a IA local deve ser gratuita, aberta, rápida e privada.

📖 Leia a fonte completa: HN LLM Tools

Ad

👀 See Also

Agente de Codificação Pi com Qwen 35B Q2: Usando Sistema de Arquivos como Memória Externa e Impondo Guardas de Contexto
Tools

Agente de Codificação Pi com Qwen 35B Q2: Usando Sistema de Arquivos como Memória Externa e Impondo Guardas de Contexto

Um usuário do Reddit construiu uma stack em torno do agente de codificação Pi com Qwen 35B Q2_K_XL quant que impõe guardiões — rejeita edições com mais de 100 linhas, limita blocos de pensamento a 2000 caracteres e monitora o contexto em 65%/80% — tratando o sistema de arquivos como a memória do modelo, não a janela de contexto.

OpenClawRadar
Voygr Lança API de Validação de Negócios para Inteligência de Localização Atualizada
Tools

Voygr Lança API de Validação de Negócios para Inteligência de Localização Atualizada

A API de Validação de Negócios da Voygr verifica se as empresas estão operando, fechadas, rebatizadas ou inválidas, agregando múltiplas fontes de dados e detectando sinais conflitantes. A equipe está construindo um perfil de local infinito e consultável que combina dados precisos de locais com contexto web atualizado, como notícias, artigos e eventos.

OpenClawRadar
O servidor MCP conecta agentes de IA a sessões existentes do Chrome com cookies e autenticação
Tools

O servidor MCP conecta agentes de IA a sessões existentes do Chrome com cookies e autenticação

@playwright-repl/mcp é um servidor MCP que conecta agentes de IA ao seu navegador Chrome existente através da extensão Dramaturg, fornecendo acesso à sua sessão real do navegador, incluindo cookies e autenticação. Ele suporta JavaScript completo do Playwright, asserções e funciona com Claude Desktop, Claude Code, Cursor ou qualquer cliente MCP.

OpenClawRadar
O ViralCanvas.ai oferece um espaço de trabalho de contexto persistente para os modelos Claude, incluindo o Sonnet 4.5.
Tools

O ViralCanvas.ai oferece um espaço de trabalho de contexto persistente para os modelos Claude, incluindo o Sonnet 4.5.

ViralCanvas.ai é um espaço de trabalho visual que funciona sobre os modelos da Claude, oferecendo acesso ao Sonnet 4.5, Sonnet 4.6, Opus 4.5 e Opus 4.6 com anexação de contexto persistente. A ferramenta aborda problemas de degradação de contexto em conversas longas mantendo documentos conectados ativamente ponderados em cada prompt.

OpenClawRadar