DocMason: Lokale Agenten-Wissensdatenbank für komplexe Office-Dateien

Was DocMason leistet

DocMason ist ein lokales, dateibasiertes Wissensdatenbanksystem, das für tiefgehende Recherchen in privaten Arbeitsdokumenten entwickelt wurde. Das Kernkonzept lautet: "Das Repo ist die App. Codex ist die Laufzeitumgebung." Es kompiliert Office-Dateien in strukturierte Beweispakete, über die KI-Agenten unter Wahrung strenger Herkunftsverfolgung schlussfolgern können.

Hauptmerkmale aus der Quelle

Verarbeitet mehrere Office-Dokumenttypen: PPTX, DOCX, XLSX, PDFs und sogar .EML-Dateien
Extrahiert multimodale Informationen einschließlich IT-Architekturdiagrammen und Excel-Tabellendaten
Bewahrt Dokumentenstruktur und visuelle Semantik (Folienlayouts, Sprechernotizen, Tabellenkalkulationsreferenzen, Formatierungssignale)
Läuft lokal ohne Cloud-Erfassung oder versteckte Backends
Ermöglicht inkrementelle Synchronisierung der Wissensdatenbank bei hinzugefügten oder überarbeiteten Dateien
Erzwingt strenge Datenverträge und Herkunftsgrenzen

Wie es funktioniert

DocMason fungiert als produktionsreife Laufzeitumgebung, die KI zwingt, die ursprüngliche Dokumentenstruktur zu respektieren. Anstatt komplexe Dateien in unstrukturierte Textblöcke zu vereinfachen, erzeugt es deterministische dateibasierte Beweise und führt Offline-Retrieval-Algorithmen lokal auf Ihrem Computer aus.

Erste Schritte

In der Quelle werden zwei Einrichtungswege beschrieben:

Weg A (Klein beginnen):

Arbeitsdateien in den Ordner DocMason/original_doc/ ablegen
Den DocMason-Ordner in Codex öffnen
Natürliche Fragen stellen – DocMason führt durch die Umgebungseinrichtung
Genehmigt Aufforderungen beim Aufbau der Wissensdatenbank

Weg B (Ganze Ordner bereitstellen):

Abreilungsweite Ordner in DocMason/original_doc/ ablegen
In Codex öffnen und sagen: "Bitte bereite die DocMason-Umgebung vor."
Dann: "Bitte baue die Wissensdatenbank auf."
Nach Abschluss komplexe Forschungsfragen zum gesamten Korpus stellen

Das System ist so gestaltet, dass Sie keine internen Befehle auswendig lernen müssen – sprechen Sie einfach natürlich mit Ihrem KI-Agenten innerhalb eines gültigen Arbeitsbereichs.

Technische Details

DocMason behebt spezifische Einschränkungen bestehender Dokumenten-KI-Tools:

Bewahrt visuelles Layout, Sprechernotizen und Diagramm-Text-Beziehungen in Präsentationen
Erhält Mehrfachblatt-Referenzen und verschachtelte Tabellen in Tabellenkalkulationen
Behält Formatierungssemantik wie roten Text für "Risiko" oder Einrückungen für Hierarchien
Ermöglicht dokumentenübergreifendes Schlussfolgern für mehrteilige Vorschläge

Die Repository-Struktur umfasst Adapter-, knowledge_base-, runtime-, skills- und sample_corpus-Verzeichnisse, wobei die Konfiguration über docmason.yaml- und pyproject.toml-Dateien verwaltet wird.

📖 Den vollständigen Source lesen: HN AI Agents