LiteParse: Analisador de Documentos Rápido e de Código Aberto para Agentes de IA

LiteParse é um analisador de documentos de código aberto focado em análise local rápida com extração espacial de texto e caixas delimitadoras. Ele executa totalmente localmente sem dependências de nuvem ou requisitos de GPU, processando centenas de páginas em segundos.
Principais Recursos
- Ferramenta de código aberto licenciada Apache 2.0
- Análise espacial de texto com caixas delimitadoras para posicionamento preciso do texto
- Sem dependência de VLMs (Modelos de Linguagem Visual) locais ou de fronteira
- Executa em qualquer máquina sem requisitos de GPU
- Suporta múltiplos formatos de arquivo: PDFs, documentos do Office, imagens
- Maior precisão do que ferramentas similares como PyPDF, PyMuPDF, MarkItDown
- Instalação em uma linha como habilidade para mais de 40 agentes de IA incluindo Claude Code, Cursor, OpenClaw, Windsurf
Opções de Instalação
Instalação da Ferramenta CLI:
npm i -g @llamaindex/liteparse
Depois use:
lit parse document.pdf
lit screenshot document.pdf
Para macOS e Linux via Homebrew:
brew tap run-llama/liteparse
brew install llamaindex-liteparse
Instalação de Habilidade para Agentes:
npx skills add run-llama/llamaparse-agent-skills --skill liteparse
Exemplos de Uso
Análise básica:
lit parse document.pdf
lit parse document.pdf --format json -o output.md
lit parse document.pdf --target-pages "1-5,10,15-20"
lit parse document.pdf --no-ocr
Análise em lote:
lit batch-parse ./input-directory ./output-directory
Geração de capturas de tela (útil para agentes LLM):
lit screenshot document.pdf -o ./screenshots
lit screenshot document.pdf --target-pages "1,3,5" -o ./screenshots
lit screenshot document.pdf --dpi 300 -o ./screenshots
lit screenshot document.pdf --target-pages "1-10" -o ./screenshots
Uso como Biblioteca
Instale como dependência:
npm install @llamaindex/liteparse
# ou
pnpm add @llamaindex/liteparse
Uso básico:
import { LiteParse } from '@llamaindex/liteparse';
const parser = new LiteParse({ ocrEnabled: true });
const result = await parser.parse('document.pdf');
console.log(result.text);
Entrada via Buffer/Uint8Array (sem I/O em disco):
import { LiteParse } from '@llamaindex/liteparse';
import { readFile } from 'fs/promises';
const parser = new LiteParse();
const pdfBytes = await readFile('document.pdf');
const result = await parser.parse(pdfBytes);
Detalhes Técnicos
- Sistema OCR flexível com Tesseract.js integrado (configuração zero)
- Suporta servidores HTTP para OCR (EasyOCR, PaddleOCR, personalizados)
- Especificação padrão da API OCR
- Múltiplos formatos de saída: JSON e Texto
- Binário independente sem dependências de nuvem
- Suporte multiplataforma: Linux, macOS (Intel/ARM), Windows
Para documentos complexos com tabelas densas, layouts de múltiplas colunas, gráficos, texto manuscrito ou PDFs digitalizados, os criadores recomendam LlamaParse, seu analisador de documentos baseado em nuvem construído para pipelines de documentos de produção.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Sistema de memória de código aberto para agentes LLM alcança altas pontuações em benchmarks
Um sistema de memória persistente para Claude Code e OpenClaw fornece aos agentes LLM continuidade de contexto entre sessões, alcançando 90,8% no LoCoMo e 89,1% nos benchmarks LongMemEval. A arquitetura baseada em adaptadores funciona com qualquer framework de agentes.

OpenClaw Smart Router de Código Aberto para Seleção Automática de Modelos
Um desenvolvedor disponibilizou em código aberto um Roteador Inteligente para OpenClaw que classifica automaticamente as consultas por complexidade e as encaminha para os modelos ideais, economizando 60-80% nos custos de API em comparação com o uso constante de modelos premium como Claude ou GPT-4o.

Chat Saver CG: Extensão de Navegador Criada com Claude Exporta Conversas de 12 Plataformas de IA
Um desenvolvedor criou o Chat Saver CG, uma extensão de navegador que exporta e transfere conversas entre Claude, ChatGPT, Gemini e outras 9 plataformas de IA, usando extensivamente o Claude para o desenvolvimento, incluindo decisões de arquitetura, depuração de problemas de análise DOM e escrita da lógica do adaptador.

A Habilidade ComfyUI Permite que Agentes de IA Enfileirem e Renderizem Imagens em Lote via Linguagem Natural
Uma nova habilidade de código aberto permite que agentes OpenClaw construam fluxos de trabalho do ComfyUI, enviem tarefas e gerenciem renderizações por meio de comandos de linguagem natural como 'Faça 50 variações deste conceito com seeds diferentes' ou 'Compare estes 4 prompts lado a lado em 1024x1024'.