DocMason: Lokale Agenten-Wissensdatenbank für komplexe Office-Dateien

Was DocMason leistet
DocMason ist ein lokales, dateibasiertes Wissensdatenbanksystem, das für tiefgehende Recherchen in privaten Arbeitsdokumenten entwickelt wurde. Das Kernkonzept lautet: "Das Repo ist die App. Codex ist die Laufzeitumgebung." Es kompiliert Office-Dateien in strukturierte Beweispakete, über die KI-Agenten unter Wahrung strenger Herkunftsverfolgung schlussfolgern können.
Hauptmerkmale aus der Quelle
- Verarbeitet mehrere Office-Dokumenttypen: PPTX, DOCX, XLSX, PDFs und sogar .EML-Dateien
- Extrahiert multimodale Informationen einschließlich IT-Architekturdiagrammen und Excel-Tabellendaten
- Bewahrt Dokumentenstruktur und visuelle Semantik (Folienlayouts, Sprechernotizen, Tabellenkalkulationsreferenzen, Formatierungssignale)
- Läuft lokal ohne Cloud-Erfassung oder versteckte Backends
- Ermöglicht inkrementelle Synchronisierung der Wissensdatenbank bei hinzugefügten oder überarbeiteten Dateien
- Erzwingt strenge Datenverträge und Herkunftsgrenzen
Wie es funktioniert
DocMason fungiert als produktionsreife Laufzeitumgebung, die KI zwingt, die ursprüngliche Dokumentenstruktur zu respektieren. Anstatt komplexe Dateien in unstrukturierte Textblöcke zu vereinfachen, erzeugt es deterministische dateibasierte Beweise und führt Offline-Retrieval-Algorithmen lokal auf Ihrem Computer aus.
Erste Schritte
In der Quelle werden zwei Einrichtungswege beschrieben:
Weg A (Klein beginnen):
- Arbeitsdateien in den Ordner
DocMason/original_doc/ablegen - Den DocMason-Ordner in Codex öffnen
- Natürliche Fragen stellen – DocMason führt durch die Umgebungseinrichtung
- Genehmigt Aufforderungen beim Aufbau der Wissensdatenbank
Weg B (Ganze Ordner bereitstellen):
- Abreilungsweite Ordner in
DocMason/original_doc/ablegen - In Codex öffnen und sagen: "Bitte bereite die DocMason-Umgebung vor."
- Dann: "Bitte baue die Wissensdatenbank auf."
- Nach Abschluss komplexe Forschungsfragen zum gesamten Korpus stellen
Das System ist so gestaltet, dass Sie keine internen Befehle auswendig lernen müssen – sprechen Sie einfach natürlich mit Ihrem KI-Agenten innerhalb eines gültigen Arbeitsbereichs.
Technische Details
DocMason behebt spezifische Einschränkungen bestehender Dokumenten-KI-Tools:
- Bewahrt visuelles Layout, Sprechernotizen und Diagramm-Text-Beziehungen in Präsentationen
- Erhält Mehrfachblatt-Referenzen und verschachtelte Tabellen in Tabellenkalkulationen
- Behält Formatierungssemantik wie roten Text für "Risiko" oder Einrückungen für Hierarchien
- Ermöglicht dokumentenübergreifendes Schlussfolgern für mehrteilige Vorschläge
Die Repository-Struktur umfasst Adapter-, knowledge_base-, runtime-, skills- und sample_corpus-Verzeichnisse, wobei die Konfiguration über docmason.yaml- und pyproject.toml-Dateien verwaltet wird.
📖 Den vollständigen Source lesen: HN AI Agents
👀 Siehe auch

OpenClaw Multi-Agent-Workflow-Probleme: Stillstand, Kontextverlust und Token-Ineffizienz
Ein Entwickler berichtet, dass OpenClaw-Multi-Agent-Workflows häufig ins Stocken geraten, wobei Agenten hängen bleiben, Kontextverluste trotz benutzerdefinierter Dokumentation auftreten und übermäßig viele Tokens ohne Ausgabe verbraucht werden. Das Setup nutzte Gemini 3 Pro/Codex-Modelle mit einem COO-Orchestrator und spezialisierten Task-Agenten.

Aufbau eines Sprachassistenten mit unter 500 ms Latenz: Architektur und Leistungseinblicke
Ein Entwickler hat einen Sprachagenten von Grund auf neu gebaut und dabei eine End-to-End-Latenz von ~400 ms mit vollständigem STT → LLM → TTS-Streaming erreicht. Wichtige Erkenntnisse umfassen die Behandlung von Sprache als Problem der Sprechwechsel, die Verwendung semantischer Sprechwechselerkennung und die gemeinsame Platzierung aller Komponenten für minimale Latenz.

Qwen 3.6 27B mit MTP auf V100 32GB: 54 t/s über llama.cpp Zweig
am17ans MTP-Zweig von llama.cc läuft Qwen 3.6 27B mit 54 t/s auf V100 32GB über PCIe-Adapter und sinkt auf 29-30 t/s ohne MTP.

„Gefundene-Probleme“-Plugin protokolliert Fehler, die Claude bei anderen Aufgaben ignoriert
Ein Claude Code Plugin, das einzeilige Einträge in docs/found-issues.md schreibt, wenn der Agent Bugs außerhalb des Aufgabenbereichs entdeckt, mit automatischer Schließung bei PR-Merge und Tombstone-Erkennung.