LiteParse: Schneller Open-Source-Dokumentenparser für KI-Agenten

LiteParse ist ein Open-Source-Dokumentenparser, der sich auf schnelle, lokale Analyse mit räumlicher Textextraktion und Begrenzungsrahmen konzentriert. Er läuft vollständig lokal ohne Cloud-Abhängigkeiten oder GPU-Anforderungen und verarbeitet Hunderte von Seiten in Sekunden.
Hauptmerkmale
- Apache 2.0 lizenziertes Open-Source-Tool
- Räumliche Textanalyse mit Begrenzungsrahmen für präzise Textpositionierung
- Keine Abhängigkeit von lokalen oder fortschrittlichen VLMs (Vision Language Models)
- Läuft auf jedem Rechner ohne GPU-Anforderungen
- Unterstützt mehrere Dateiformate: PDFs, Office-Dokumente, Bilder
- Höhere Genauigkeit als ähnliche Tools wie PyPDF, PyMuPDF, MarkItDown
- Einzeilige Installation als Fähigkeit für über 40 KI-Agenten, darunter Claude Code, Cursor, OpenClaw, Windsurf
Installationsoptionen
CLI-Tool-Installation:
npm i -g @llamaindex/liteparse
Dann verwenden:
lit parse document.pdf
lit screenshot document.pdf
Für macOS und Linux über Homebrew:
brew tap run-llama/liteparse
brew install llamaindex-liteparse
Agent-Fähigkeitsinstallation:
npx skills add run-llama/llamaparse-agent-skills --skill liteparse
Anwendungsbeispiele
Grundlegende Analyse:
lit parse document.pdf
lit parse document.pdf --format json -o output.md
lit parse document.pdf --target-pages "1-5,10,15-20"
lit parse document.pdf --no-ocr
Stapelanalyse:
lit batch-parse ./input-directory ./output-directory
Screenshot-Erstellung (nützlich für LLM-Agenten):
lit screenshot document.pdf -o ./screenshots
lit screenshot document.pdf --target-pages "1,3,5" -o ./screenshots
lit screenshot document.pdf --dpi 300 -o ./screenshots
lit screenshot document.pdf --target-pages "1-10" -o ./screenshots
Bibliotheksnutzung
Als Abhängigkeit installieren:
npm install @llamaindex/liteparse
# oder
pnpm add @llamaindex/liteparse
Grundlegende Nutzung:
import { LiteParse } from '@llamaindex/liteparse';
const parser = new LiteParse({ ocrEnabled: true });
const result = await parser.parse('document.pdf');
console.log(result.text);
Buffer/Uint8Array-Eingabe (keine Festplatten-E/A):
import { LiteParse } from '@llamaindex/liteparse';
import { readFile } from 'fs/promises';
const parser = new LiteParse();
const pdfBytes = await readFile('document.pdf');
const result = await parser.parse(pdfBytes);
Technische Details
- Flexibles OCR-System mit integriertem Tesseract.js (keine Einrichtung erforderlich)
- Unterstützt HTTP-Server für OCR (EasyOCR, PaddleOCR, benutzerdefiniert)
- Standard-OCR-API-Spezifikation
- Mehrere Ausgabeformate: JSON und Text
- Eigenständige Binärdatei ohne Cloud-Abhängigkeiten
- Multiplattform-Unterstützung: Linux, macOS (Intel/ARM), Windows
Für komplexe Dokumente mit dichten Tabellen, mehrspaltigen Layouts, Diagrammen, handgeschriebenem Text oder gescannten PDFs empfehlen die Entwickler LlamaParse, ihren cloudbasierten Dokumentenparser für Produktions-Dokumentenpipelines.
📖 Den vollständigen Source lesen: HN AI Agents
👀 Siehe auch

Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %
Ein Entwickler hat einen Kontext-Engine-MCP-Server erstellt, der Claude Code einen Abhängigkeitsgraphen von Codebasen bereitstellt und so die Token-Nutzung zunächst um 65 % reduziert. Eine neue Single-Call-Pipeline senkt die Token weiter um 74 %, indem sie mehrere Roundtrips eliminiert und Ergebnisse serverseitig dedupliziert.

AI mit kleinen Bots erkunden: Künstliche Intelligenz-Agenten durch Nanobot-Tutoren verstehen
Ein Mitglied der OpenClaw-Community teilt Einblicke in den 'Nanobot Tutor', ein kompaktes Framework, das darauf abzielt, die Funktionsweise von KI-Agenten zu entmystifizieren. Entdecken Sie, wie das Eintauchen in diese kompakte Lernumgebung die Arbeitsweise intelligenter Agenten enthüllt.

DeepClaude ersetzt das Anthropic-Backend von Claude Code durch DeepSeek V4 Pro zu 17-fach niedrigeren Kosten
Ein Skript, das die Umgebungsvariablen von Claude Code umschreibt, sodass alle Agentenloop-Aufrufe über DeepSeek V4 Pro, OpenRouter oder Fireworks AI laufen – gleiche UX, 0,87 $/M Output-Tokens statt 15 $/M.

VoidLLM: Zero-Knowledge-Proxy für Ollama und vLLM mit Team-Zugriffskontrolle
VoidLLM ist ein Proxy, der zwischen Anwendungen und lokalen LLM-Servern wie Ollama und vLLM sitzt. Er fügt Organisations-/Team-Zugriffskontrolle, API-Schlüsselverwaltung, Nutzungsverfolgung und Ratenbegrenzung hinzu, ohne die Prompts einzusehen. Er hat einen Proxy-Overhead von <2ms und funktioniert mit OpenAI-kompatiblen SDKs.