DocMason : Base de connaissances d'agent local pour les fichiers bureautiques complexes

✍️ OpenClawRadar📅 Publié: April 15, 2026🔗 Source
DocMason : Base de connaissances d'agent local pour les fichiers bureautiques complexes
Ad

Ce que fait DocMason

DocMason est un système de base de connaissances local basé sur des fichiers, conçu pour une recherche approfondie sur des documents de travail privés. Le concept central est "Le dépôt est l'application. Codex est l'environnement d'exécution." Il compile les fichiers bureautiques en ensembles de preuves structurées sur lesquelles les agents IA peuvent raisonner tout en maintenant un suivi strict de la provenance.

Fonctionnalités clés de la Source

  • Gère plusieurs types de documents bureautiques : PPTX, DOCX, XLSX, PDF, et même les fichiers .EML
  • Extrait des informations multimodales incluant des diagrammes d'architecture informatique et des données de feuilles Excel
  • Conserve la structure des documents et la sémantique visuelle (mises en page des diapositives, notes du présentateur, références de feuilles de calcul, signaux de formatage)
  • Fonctionne localement sans ingestion dans le cloud ni backends cachés
  • Fournit une synchronisation incrémentielle de la base de connaissances lors de l'ajout ou de la révision de fichiers
  • Applique des contrats de données stricts et des limites de provenance

Comment cela fonctionne

DocMason fonctionne comme un environnement d'exécution de qualité production qui force l'IA à respecter la structure originale des documents. Au lieu d'aplatir les fichiers complexes en blocs de texte non structurés, il crée des preuves déterministes basées sur des fichiers et exécute des algorithmes de récupération hors ligne localement sur votre machine.

Ad

Pour commencer

Deux chemins de configuration sont décrits dans la source :

Chemin A (Démarrage léger) :

  • Déposez les fichiers de travail dans le dossier DocMason/original_doc/
  • Ouvrez le dossier DocMason dans Codex
  • Posez des questions naturellement - DocMason vous guide dans la configuration de l'environnement
  • Approuve les invites lors de la construction de la base de connaissances

Chemin B (Préparer des dossiers entiers) :

  • Déposez des dossiers au niveau départemental dans DocMason/original_doc/
  • Ouvrez dans Codex et dites-lui : "Veuillez préparer l'environnement DocMason."
  • Puis : "Veuillez construire la base de connaissances."
  • Une fois terminé, posez des questions de recherche complexes sur l'ensemble du corpus

Le système est conçu pour que vous n'ayez pas à mémoriser des commandes internes - parlez simplement naturellement à votre agent IA dans un espace de travail valide.

Détails techniques

DocMason répond à des limitations spécifiques des outils d'IA documentaire existants :

  • Préserve la mise en page visuelle, les notes du présentateur et les relations texte-diagramme dans les présentations
  • Maintient les références multi-feuilles et les tableaux imbriqués dans les feuilles de calcul
  • Conserve la sémantique de formatage comme le texte rouge pour "Risque" ou l'indentation pour les hiérarchies
  • Permet un raisonnement inter-documents pour les propositions en plusieurs parties

La structure du dépôt comprend des répertoires adaptateurs, knowledge_base, runtime, skills et sample_corpus, avec une configuration gérée via les fichiers docmason.yaml et pyproject.toml.

📖 Lire la Source complète : HN AI Agents

Ad

👀 See Also

Encre : Une plateforme de déploiement où les agents IA Claude sont les utilisateurs principaux
Tools

Encre : Une plateforme de déploiement où les agents IA Claude sont les utilisateurs principaux

Ink (ml.ink) est une plateforme de déploiement conçue pour les agents d'IA comme Claude, offrant un déploiement par simple appel d'outil, une détection automatique des frameworks, et des services intégrés incluant le calcul, les bases de données, le DNS, les secrets, les domaines, les métriques et les journaux.

OpenClawRadar
Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI
Tools

Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI

Le Principe de Capacité de Charge v9 est un cadre structurel bidirectionnel qui utilise une seule image de diagramme de flux au lieu d'invites textuelles pour Claude IA. Il fournit un diagnostic structurel ou des plans de construction génératifs basés sur les paramètres du système ou les objectifs.

OpenClawRadar
Forge : Le Plugin Open-Source Claude Code Ajoute des Portails de Gouvernance et de Tests
Tools

Forge : Le Plugin Open-Source Claude Code Ajoute des Portails de Gouvernance et de Tests

Forge est un plugin open-source pour Claude Code qui ajoute le verrouillage de fichiers, des portails de tests automatisés et 22 agents de gouvernance pour prévenir les collisions et les dérives dans les flux de travail de code généré par IA. Il est sous licence MIT et s'installe via la marketplace de plugins Claude.

OpenClawRadar
Collection de Styles de Sortie Personnalisés pour Claude Code
Tools

Collection de Styles de Sortie Personnalisés pour Claude Code

Un développeur a créé 13 styles de sortie personnalisés pour Claude Code qui modifient le comportement de l'IA via des invites système. Les styles incluent Roast pour une critique de code brutale, Socratic pour un questionnement guidé, Breaker pour des tests adversariaux, Ship It pour des solutions pragmatiques, Paranoid pour une focalisation sur la sécurité, et TDD pour le développement piloté par les tests.

OpenClawRadar