LiteParse: Open-Source-Parser für KI-Agenten installieren

LiteParse ist ein Open-Source-Dokumentenparser, der sich auf schnelle, lokale Analyse mit räumlicher Textextraktion und Begrenzungsrahmen konzentriert. Er läuft vollständig lokal ohne Cloud-Abhängigkeiten oder GPU-Anforderungen und verarbeitet Hunderte von Seiten in Sekunden.

Hauptmerkmale

Apache 2.0 lizenziertes Open-Source-Tool
Räumliche Textanalyse mit Begrenzungsrahmen für präzise Textpositionierung
Keine Abhängigkeit von lokalen oder fortschrittlichen VLMs (Vision Language Models)
Läuft auf jedem Rechner ohne GPU-Anforderungen
Unterstützt mehrere Dateiformate: PDFs, Office-Dokumente, Bilder
Höhere Genauigkeit als ähnliche Tools wie PyPDF, PyMuPDF, MarkItDown
Einzeilige Installation als Fähigkeit für über 40 KI-Agenten, darunter Claude Code, Cursor, OpenClaw, Windsurf

Installationsoptionen

CLI-Tool-Installation:

npm i -g @llamaindex/liteparse

Dann verwenden:

lit parse document.pdf
lit screenshot document.pdf

Für macOS und Linux über Homebrew:

brew tap run-llama/liteparse
brew install llamaindex-liteparse

Agent-Fähigkeitsinstallation:

npx skills add run-llama/llamaparse-agent-skills --skill liteparse

Anwendungsbeispiele

Grundlegende Analyse:

lit parse document.pdf
lit parse document.pdf --format json -o output.md
lit parse document.pdf --target-pages "1-5,10,15-20"
lit parse document.pdf --no-ocr

Stapelanalyse:

lit batch-parse ./input-directory ./output-directory

Screenshot-Erstellung (nützlich für LLM-Agenten):

lit screenshot document.pdf -o ./screenshots
lit screenshot document.pdf --target-pages "1,3,5" -o ./screenshots
lit screenshot document.pdf --dpi 300 -o ./screenshots
lit screenshot document.pdf --target-pages "1-10" -o ./screenshots

Bibliotheksnutzung

Als Abhängigkeit installieren:

npm install @llamaindex/liteparse
# oder
pnpm add @llamaindex/liteparse

Grundlegende Nutzung:

import { LiteParse } from '@llamaindex/liteparse';
const parser = new LiteParse({ ocrEnabled: true });
const result = await parser.parse('document.pdf');
console.log(result.text);

Buffer/Uint8Array-Eingabe (keine Festplatten-E/A):

import { LiteParse } from '@llamaindex/liteparse';
import { readFile } from 'fs/promises';
const parser = new LiteParse();
const pdfBytes = await readFile('document.pdf');
const result = await parser.parse(pdfBytes);

Technische Details

Flexibles OCR-System mit integriertem Tesseract.js (keine Einrichtung erforderlich)
Unterstützt HTTP-Server für OCR (EasyOCR, PaddleOCR, benutzerdefiniert)
Standard-OCR-API-Spezifikation
Mehrere Ausgabeformate: JSON und Text
Eigenständige Binärdatei ohne Cloud-Abhängigkeiten
Multiplattform-Unterstützung: Linux, macOS (Intel/ARM), Windows

Für komplexe Dokumente mit dichten Tabellen, mehrspaltigen Layouts, Diagrammen, handgeschriebenem Text oder gescannten PDFs empfehlen die Entwickler LlamaParse, ihren cloudbasierten Dokumentenparser für Produktions-Dokumentenpipelines.

📖 Den vollständigen Source lesen: HN AI Agents