Canal de Traducción de Libros Local Utiliza Qwen 32B y Mistral 24B con RAG Contextual

✍️ OpenClawRadar📅 Publicado: 1 de abril de 2026🔗 Source
Canal de Traducción de Libros Local Utiliza Qwen 32B y Mistral 24B con RAG Contextual
Ad

Un desarrollador ha creado una canalización de traducción de libros completamente local y automatizada que convierte archivos PDF a formato ePub utilizando ocho scripts de Python. El sistema aborda problemas comunes de traducción como la pérdida de contexto y problemas de formato mediante un flujo de trabajo de múltiples pasos.

Detalles del Flujo de Trabajo

La canalización consta de ocho scripts que manejan todo el proceso:

  • Extracción de PDF: Utiliza Marker para extraer contenido de PDFs mientras preserva elementos de formato como texto en negrita, capítulos e imágenes
  • Segmentación de Texto: Divide el texto extraído en fragmentos manejables
  • Creación de Contexto: Antes de la traducción, envía extractos de todo el libro a Qwen 32B para generar una "Super Biblia" - un glosario global que contiene personajes, tono y atmósfera
  • Traducción: Qwen 32B traduce cada segmento de texto mientras referencia la Super Biblia para mantener la consistencia
  • Edición de Estilo: Mistral 24B actúa como editor, revisando las traducciones de Qwen y reescribiéndolas para un estilo literario perfecto
  • Ensamblaje: Un script final reensambla todos los segmentos traducidos, reinserta las imágenes y utiliza Pandoc para generar un archivo ePub pulido
Ad

Características de Automatización

El sistema incluye un script de monitoreo que observa una carpeta designada. Los usuarios simplemente colocan un PDF en esta carpeta, y la canalización lo procesa automáticamente. Después de varias horas, el sistema genera tanto el ePub traducido como un recibo que muestra el tiempo de procesamiento.

El desarrollador señala que los resultados son sorprendentemente efectivos, aunque no 100% perfectos, y menciona tener varias ideas de mejora. Todo el sistema se ejecuta localmente en una computadora personal sin requerir servicios externos.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

yburn: Herramienta para auditar y reemplazar trabajos cron de agentes de IA innecesarios
Herramientas

yburn: Herramienta para auditar y reemplazar trabajos cron de agentes de IA innecesarios

yburn es una herramienta de Python que audita los trabajos cron de agentes de IA y reemplaza aquellos que no necesitan LLMs con scripts de Python independientes. El creador encontró que el 58% de 98 trabajos cron eran tareas puramente mecánicas como comprobaciones de salud del sistema y copias de seguridad de git.

OpenClawRadar
Mímir: Un Sistema de Memoria en Python Basado en 21 Mecanismos de Neurociencia
Herramientas

Mímir: Un Sistema de Memoria en Python Basado en 21 Mecanismos de Neurociencia

Mímir es un sistema de memoria en Python para agentes de IA que implementa 21 mecanismos de la ciencia cognitiva, como la memoria flashbulb y el olvido inducido por recuperación. Utiliza un índice híbrido BM25 + semántico + de fecha y muestra mejoras en los puntos de referencia, incluyendo un 13% más de precisión en herramientas en Mem2ActBench frente a VividnessMem.

OpenClawRadar
Agoragentic: mercado de agentes instalable con pip para comprar y vender capacidades
Herramientas

Agoragentic: mercado de agentes instalable con pip para comprar y vender capacidades

Agoragentic es un mercado de agente a agente donde los agentes de IA pueden descubrir e invocar capacidades de otros agentes mediante una integración instalable con pip. El mercado utiliza USDC en Base L2 para pagos con una tarifa de plataforma del 3% y ofrece créditos de prueba gratuitos.

OpenClawRadar
Gancho de puntuación de confianza de código abierto para Claude Code monitorea sesiones, bloquea rutas protegidas
Herramientas

Gancho de puntuación de confianza de código abierto para Claude Code monitorea sesiones, bloquea rutas protegidas

Un desarrollador creó un gancho en Python que puntúa cada sesión de Claude Code en dimensiones de confiabilidad, alcance y costo, bloquea el acceso a rutas protegidas como archivos .env, y encadena eventos con hash para detección de manipulaciones. La herramienta de un solo archivo está disponible en GitHub.

OpenClawRadar