TextGen (text-generation-webui) se convierte en aplicación de escritorio nativa con compilaciones portátiles
TextGen (anteriormente text-generation-webui, también conocido como oobabooga) ha lanzado una versión nativa de aplicación de escritorio. El proyecto, en desarrollo desde diciembre de 2022, ahora ofrece versiones portátiles: solo descarga, descomprime y haz doble clic en textgen. Sin instalación ni archivos fuera de la carpeta extraída. Todo el historial de chats y configuraciones residen en una carpeta user_data incluida.
Características principales
- Privacidad: Cero solicitudes salientes. A diferencia de LM Studio, no envía información del sistema operativo, CPU, versión de la aplicación o selección de backend.
- Compilaciones ik_llama.cpp: Incluye tipos de cuantización personalizados como IQ4_KS e IQ5_KS para mayor precisión en comparación con vanilla llama.cpp utilizado por LM Studio y Ollama.
- Búsqueda web integrada: Utiliza la biblioteca Python
ddgs. Dos modos: llamada a herramientas con la herramientaweb_search(funciona con Qwen 3.6 y Gemma 4) o una casilla de verificación que obtiene resultados de búsqueda como archivos de texto adjuntos. - Llamada a herramientas: Soporta herramientas .py de un solo archivo (funciones personalizadas fáciles), servidores HTTP MCP y servidores stdio MCP. Opción para requerir aprobación/rechazo antes de ejecutar llamadas a herramientas. Guía aquí.
- Personajes personalizados: Crea personajes para chats casuales junto con conversaciones de instrucciones.
- Compatibilidad de API: API compatible con las especificaciones de OpenAI y Anthropic. Funciona con Claude Code:
ANTHROPIC_BASE_URL=http://127.0.0.1:5000 claude. - Extracción de PDF: Utiliza PyMuPDF para una extracción precisa de texto.
- Obtención de páginas web: Utiliza
trafilaturapara eliminar navegación y contenido superfluo, ahorrando tokens en bucles agentivos. - Plantillas Jinja2: Renderiza plantillas de chat mediante Python Jinja2, evitando fallos en la reimplementación de jinja en C++ de llama.cpp.
Versiones disponibles
CUDA, Vulkan, solo CPU, Mac (Apple Silicon e Intel) y ROCm. Todas portátiles.
Licencia: AGPLv3. Fuente: https://github.com/oobabooga/textgen
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Herramienta Local de Crítico de Imágenes con IA Utiliza Modelos de Visión Ollama para Retroalimentación
Un desarrollador ha creado una aplicación de escritorio gratuita que analiza imágenes generadas por IA localmente utilizando modelos de visión de Ollama. La herramienta proporciona informes de retroalimentación estructurados que incluyen sugerencias de mejora y actualizaciones de prompts.

Presentamos cltree: una TUI de árbol de archivos para Claude Code.
<strong>cltree</strong> es una interfaz de usuario en terminal de panel dividido (TUI) que muestra el árbol de archivos de tu proyecto en tiempo real junto a Claude Code, mostrando el directorio de trabajo actual, ocultando el ruido y permitiendo que todas las pulsaciones de teclas pasen sin interferencias.

Usuario de Reddit Prueba la Función de Autoaprendizaje del Agente de IA Hermes, Encuentra Fallos Críticos
Un usuario de Reddit probó la función de autoaprendizaje del agente de IA Hermes, que crea habilidades automáticamente a partir de archivos markdown. El usuario descubrió que siempre evalúa sus propios resultados como exitosos, incluso cuando la salida es incorrecta, y sobrescribe las ediciones manuales.

Engramx v3.4: MCP Server + Grafo de Conocimiento SQLite Reduce el Uso de Tokens de Claude Code en un 89%
Engramx v3.4 intercepta las lecturas de archivos para los agentes de Claude Code, devolviendo resúmenes estructurales en lugar del contenido bruto. Los benchmarks muestran una reducción agregada de tokens del 89.1% en una base de código de 87 archivos.