Pipeline de Tradução de Livros Locais Utiliza Qwen 32B e Mistral 24B com RAG Contextual

✍️ OpenClawRadar📅 Publicado: April 1, 2026🔗 Source
Pipeline de Tradução de Livros Locais Utiliza Qwen 32B e Mistral 24B com RAG Contextual
Ad

Um desenvolvedor criou um pipeline de tradução de livros totalmente local e automatizado que converte arquivos PDF para o formato ePub usando oito scripts Python. O sistema aborda problemas comuns de tradução, como perda de contexto e problemas de formatação, por meio de um fluxo de trabalho em várias etapas.

Detalhes do Fluxo de Trabalho

O pipeline consiste em oito scripts que lidam com todo o processo:

  • Extração de PDF: Usa o Marker para extrair conteúdo de PDFs, preservando elementos de formatação como texto em negrito, capítulos e imagens
  • Segmentação de Texto: Divide o texto extraído em partes gerenciáveis
  • Criação de Contexto: Antes da tradução, envia trechos de todo o livro para o Qwen 32B para gerar uma "Super Bíblia" - um glossário global contendo personagens, tom e atmosfera
  • Tradução: O Qwen 32B traduz cada segmento de texto enquanto consulta a Super Bíblia para manter a consistência
  • Edição de Estilo: O Mistral 24B atua como editor, revisando as traduções do Qwen e reescrevendo-as para um estilo literário perfeito
  • Montagem: Um script final remonta todos os segmentos traduzidos, reinsere as imagens e usa o Pandoc para gerar um arquivo ePub polido
Ad

Recursos de Automação

O sistema inclui um script de monitoramento que observa uma pasta designada. Os usuários simplesmente soltam um PDF nesta pasta, e o pipeline processa automaticamente. Após várias horas, o sistema gera tanto o ePub traduzido quanto um recibo mostrando o tempo de processamento.

O desenvolvedor observa que os resultados são surpreendentemente eficazes, embora não sejam 100% perfeitos, e menciona ter várias ideias de melhorias. Todo o sistema funciona localmente em um computador pessoal sem exigir serviços externos.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Claude Code HUD: Painel de Terminal para Monitoramento de Sessões de Codificação com IA
Tools

Claude Code HUD: Painel de Terminal para Monitoramento de Sessões de Codificação com IA

claude-code-hud é um painel de terminal que fornece monitoramento em tempo real para sessões do Claude Code, mostrando o uso da janela de contexto, limites de taxa da API e alterações de arquivos sem exigir uma IDE. Execute-o com npx claude-code-hud.

OpenClawRadar
PageAgent: Agente de IA para Navegador que Opera Dentro de Páginas Web com Suporte a Ollama
Tools

PageAgent: Agente de IA para Navegador que Opera Dentro de Páginas Web com Suporte a Ollama

PageAgent é uma biblioteca JavaScript que executa agentes de IA diretamente dentro de páginas web, lendo o DOM ao vivo como texto em vez de usar capturas de tela. Funciona com qualquer endpoint compatível com OpenAI, incluindo Ollama, permitindo chamadas de LLM locais diretamente do navegador.

OpenClawRadar
MarkView: Ferramenta de código aberto renderiza e gerencia arquivos Markdown gerados por IA
Tools

MarkView: Ferramenta de código aberto renderiza e gerencia arquivos Markdown gerados por IA

MarkView é um mecanismo de renderização com foco em privacidade que exibe arquivos Markdown com diagramas Mermaid e fórmulas matemáticas KaTeX, disponível como aplicativo web, aplicativo nativo para macOS e servidor MCP para integração com Claude Desktop e Cursor.

OpenClawRadar
Servidor MCP de Análise First Claude: Dando Acesso Direto a Agentes de IA ao Contexto de Análise Web
Tools

Servidor MCP de Análise First Claude: Dando Acesso Direto a Agentes de IA ao Contexto de Análise Web

Um desenvolvedor reconstruiu sua ferramenta de análise web como um servidor MCP, expondo análises web simples, links rastreáveis e ferramentas de insight de produto diretamente ao Claude, permitindo que agentes de IA aproveitem dados do site junto com contexto de código e banco de dados.

OpenClawRadar