TextGen (text-generation-webui) torna-se aplicativo desktop nativo com versões portáteis

✍️ OpenClawRadar📅 Publicado: May 13, 2026🔗 Source
Ad

O TextGen (antigo text-generation-webui, também conhecido como oobabooga) lançou uma versão nativa para desktop. O projeto, em desenvolvimento desde dezembro de 2022, agora oferece versões portáteis — basta baixar, descompactar e clicar duas vezes em textgen. Sem instalação ou arquivos fora da pasta extraída. Todo o histórico de chats e configurações ficam em uma pasta user_data inclusa.

Principais Recursos

  • Privacidade: Nenhuma requisição externa. Ao contrário do LM Studio, ele não envia informações sobre SO, CPU, versão do app ou backends escolhidos.
  • Builds ik_llama.cpp: Inclui tipos de quantização personalizados como IQ4_KS e IQ5_KS para melhor precisão em comparação com o llama.cpp padrão usado pelo LM Studio e Ollama.
  • Pesquisa web integrada: Usa a biblioteca Python ddgs. Dois modos: chamada de ferramenta com a ferramenta web_search (funciona com Qwen 3.6 e Gemma 4) ou uma caixa de seleção que busca resultados como anexos de texto.
  • Chamada de ferramentas: Suporta ferramentas .py de arquivo único (funções personalizadas fáceis), servidores HTTP MCP e servidores stdio MCP. Opção de exigir confirmação de aprovação/rejeição antes de executar chamadas de ferramenta. Guia aqui.
  • Personagens personalizados: Crie personagens para chats casuais junto com conversas de instrução.
  • Compatibilidade de API: API compatível com as especificações OpenAI e Anthropic. Funciona com Claude Code: ANTHROPIC_BASE_URL=http://127.0.0.1:5000 claude.
  • Extração de PDF: Usa PyMuPDF para extração precisa de texto.
  • Busca de páginas web: Usa trafilatura para remover navegação/ conteúdo irrelevante, economizando tokens em loops agentes.
  • Templates Jinja2: Renderiza templates de chat via Python Jinja2, evitando travamentos na reimplementação em C++ do jinja do llama.cpp.
Ad

Versões Disponíveis

CUDA, Vulkan, apenas CPU, Mac (Apple Silicon e Intel) e ROCm. Todas portáteis.

Licença: AGPLv3. Fonte: https://github.com/oobabooga/textgen

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Executando NemoClaw com vLLM Local: Notas de Configuração e Observações de Engenharia de Agentes
Tools

Executando NemoClaw com vLLM Local: Notas de Configuração e Observações de Engenharia de Agentes

Um desenvolvedor documentou a execução da plataforma de agentes de IA em sandbox NemoClaw da NVIDIA com um modelo local Nemotron 9B v2 via vLLM no WSL2. As principais descobertas incluem detalhes de roteamento de inferência, problemas de compatibilidade do analisador e observações sobre a lacuna na engenharia de agentes.

OpenClawRadar
Recuperação de código para agentes de IA: Por que embeddings vetoriais falham e gráficos LLM por arquivo vencem
Tools

Recuperação de código para agentes de IA: Por que embeddings vetoriais falham e gráficos LLM por arquivo vencem

Após um ano construindo um sistema de indexação de código, a equipe por trás do Bytebell descobriu que embeddings vetoriais em chunks de código e ASTs do Tree-sitter ambos ficaram aquém, enquanto resumos LLM por arquivo armazenados em um grafo Neo4j com busca semântica de texto completo melhoraram significativamente a precisão da recuperação.

OpenClawRadar
Calibre: Ferramenta CLI local gera configurações de assistente de IA para programação a partir do seu repositório
Tools

Calibre: Ferramenta CLI local gera configurações de assistente de IA para programação a partir do seu repositório

Caliber é uma ferramenta CLI local-first que escaneia repositórios em linguagens como TypeScript, Python, Go e Rust, e então gera arquivos de prompt e configuração para assistentes de codificação de IA, incluindo Claude Code, Cursor e Codex. Ele roda inteiramente na sua máquina com suas próprias chaves, tem 13k instalações no npm e é de código aberto sob licença MIT.

OpenClawRadar
Executador de Benchmark de Código Aberto para Testar Agentes OpenClaw em Fluxos de Trabalho Reais
Tools

Executador de Benchmark de Código Aberto para Testar Agentes OpenClaw em Fluxos de Trabalho Reais

Um novo projeto de código aberto permite que você compare agentes OpenClaw com suas próprias tarefas privadas e realistas definidas em YAML, com suporte para importar workspaces reais dos agentes.

OpenClawRadar