LiteParse: Schneller Open-Source-Dokumentenparser für KI-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 21. März 2026🔗 Source
LiteParse: Schneller Open-Source-Dokumentenparser für KI-Agenten
Ad

LiteParse ist ein Open-Source-Dokumentenparser, der sich auf schnelle, lokale Analyse mit räumlicher Textextraktion und Begrenzungsrahmen konzentriert. Er läuft vollständig lokal ohne Cloud-Abhängigkeiten oder GPU-Anforderungen und verarbeitet Hunderte von Seiten in Sekunden.

Hauptmerkmale

  • Apache 2.0 lizenziertes Open-Source-Tool
  • Räumliche Textanalyse mit Begrenzungsrahmen für präzise Textpositionierung
  • Keine Abhängigkeit von lokalen oder fortschrittlichen VLMs (Vision Language Models)
  • Läuft auf jedem Rechner ohne GPU-Anforderungen
  • Unterstützt mehrere Dateiformate: PDFs, Office-Dokumente, Bilder
  • Höhere Genauigkeit als ähnliche Tools wie PyPDF, PyMuPDF, MarkItDown
  • Einzeilige Installation als Fähigkeit für über 40 KI-Agenten, darunter Claude Code, Cursor, OpenClaw, Windsurf

Installationsoptionen

CLI-Tool-Installation:

npm i -g @llamaindex/liteparse

Dann verwenden:

lit parse document.pdf
lit screenshot document.pdf

Für macOS und Linux über Homebrew:

brew tap run-llama/liteparse
brew install llamaindex-liteparse

Agent-Fähigkeitsinstallation:

npx skills add run-llama/llamaparse-agent-skills --skill liteparse

Anwendungsbeispiele

Grundlegende Analyse:

lit parse document.pdf
lit parse document.pdf --format json -o output.md
lit parse document.pdf --target-pages "1-5,10,15-20"
lit parse document.pdf --no-ocr

Stapelanalyse:

lit batch-parse ./input-directory ./output-directory

Screenshot-Erstellung (nützlich für LLM-Agenten):

lit screenshot document.pdf -o ./screenshots
lit screenshot document.pdf --target-pages "1,3,5" -o ./screenshots
lit screenshot document.pdf --dpi 300 -o ./screenshots
lit screenshot document.pdf --target-pages "1-10" -o ./screenshots
Ad

Bibliotheksnutzung

Als Abhängigkeit installieren:

npm install @llamaindex/liteparse
# oder
pnpm add @llamaindex/liteparse

Grundlegende Nutzung:

import { LiteParse } from '@llamaindex/liteparse';
const parser = new LiteParse({ ocrEnabled: true });
const result = await parser.parse('document.pdf');
console.log(result.text);

Buffer/Uint8Array-Eingabe (keine Festplatten-E/A):

import { LiteParse } from '@llamaindex/liteparse';
import { readFile } from 'fs/promises';
const parser = new LiteParse();
const pdfBytes = await readFile('document.pdf');
const result = await parser.parse(pdfBytes);

Technische Details

  • Flexibles OCR-System mit integriertem Tesseract.js (keine Einrichtung erforderlich)
  • Unterstützt HTTP-Server für OCR (EasyOCR, PaddleOCR, benutzerdefiniert)
  • Standard-OCR-API-Spezifikation
  • Mehrere Ausgabeformate: JSON und Text
  • Eigenständige Binärdatei ohne Cloud-Abhängigkeiten
  • Multiplattform-Unterstützung: Linux, macOS (Intel/ARM), Windows

Für komplexe Dokumente mit dichten Tabellen, mehrspaltigen Layouts, Diagrammen, handgeschriebenem Text oder gescannten PDFs empfehlen die Entwickler LlamaParse, ihren cloudbasierten Dokumentenparser für Produktions-Dokumentenpipelines.

📖 Den vollständigen Source lesen: HN AI Agents

Ad

👀 Siehe auch

Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %
Werkzeuge

Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %

Ein Entwickler hat einen Kontext-Engine-MCP-Server erstellt, der Claude Code einen Abhängigkeitsgraphen von Codebasen bereitstellt und so die Token-Nutzung zunächst um 65 % reduziert. Eine neue Single-Call-Pipeline senkt die Token weiter um 74 %, indem sie mehrere Roundtrips eliminiert und Ergebnisse serverseitig dedupliziert.

OpenClawRadar
AI mit kleinen Bots erkunden: Künstliche Intelligenz-Agenten durch Nanobot-Tutoren verstehen
Werkzeuge

AI mit kleinen Bots erkunden: Künstliche Intelligenz-Agenten durch Nanobot-Tutoren verstehen

Ein Mitglied der OpenClaw-Community teilt Einblicke in den 'Nanobot Tutor', ein kompaktes Framework, das darauf abzielt, die Funktionsweise von KI-Agenten zu entmystifizieren. Entdecken Sie, wie das Eintauchen in diese kompakte Lernumgebung die Arbeitsweise intelligenter Agenten enthüllt.

OpenClawRadar
DeepClaude ersetzt das Anthropic-Backend von Claude Code durch DeepSeek V4 Pro zu 17-fach niedrigeren Kosten
Werkzeuge

DeepClaude ersetzt das Anthropic-Backend von Claude Code durch DeepSeek V4 Pro zu 17-fach niedrigeren Kosten

Ein Skript, das die Umgebungsvariablen von Claude Code umschreibt, sodass alle Agentenloop-Aufrufe über DeepSeek V4 Pro, OpenRouter oder Fireworks AI laufen – gleiche UX, 0,87 $/M Output-Tokens statt 15 $/M.

OpenClawRadar
VoidLLM: Zero-Knowledge-Proxy für Ollama und vLLM mit Team-Zugriffskontrolle
Werkzeuge

VoidLLM: Zero-Knowledge-Proxy für Ollama und vLLM mit Team-Zugriffskontrolle

VoidLLM ist ein Proxy, der zwischen Anwendungen und lokalen LLM-Servern wie Ollama und vLLM sitzt. Er fügt Organisations-/Team-Zugriffskontrolle, API-Schlüsselverwaltung, Nutzungsverfolgung und Ratenbegrenzung hinzu, ohne die Prompts einzusehen. Er hat einen Proxy-Overhead von <2ms und funktioniert mit OpenAI-kompatiblen SDKs.

OpenClawRadar