DocMason: 복잡한 오피스 파일을 위한 로컬 에이전트 지식 베이스

DocMason의 기능
DocMason은 개인 업무 문서에 대한 심층 연구를 위해 설계된 로컬 파일 기반 지식 베이스 시스템입니다. 핵심 개념은 "레포가 앱이다. Codex가 런타임이다."입니다. 이 시스템은 오피스 파일을 구조화된 증거 번들로 컴파일하여 AI 에이전트가 엄격한 출처 추적을 유지하면서 추론할 수 있도록 합니다.
소스의 주요 기능
- 다양한 오피스 문서 형식 처리: PPTX, DOCX, XLSX, PDF, 심지어 .EML 파일까지
- IT 아키텍처 다이어그램과 Excel 시트 데이터를 포함한 멀티모달 정보 추출
- 문서 구조와 시각적 의미 보존 (슬라이드 레이아웃, 발표자 노트, 스프레드시트 참조, 서식 신호)
- 클라우드 수집이나 숨겨진 백엔드 없이 로컬에서 실행
- 파일이 추가되거나 수정될 때 증분 지식 베이스 동기화 제공
- 엄격한 데이터 계약과 출처 경계 적용
작동 방식
DocMason은 AI가 원본 문서 구조를 존중하도록 강제하는 프로덕션 등급 런타임으로 작동합니다. 복잡한 파일을 비구조화된 텍스트 블롭으로 평평하게 만드는 대신, 결정론적 파일 기반 증거를 생성하고 오프라인 검색 알고리즘을 로컬 머신에서 실행합니다.
시작하기
소스에는 두 가지 설정 경로가 설명되어 있습니다:
경로 A (작게 시작):
- 업무 파일을
DocMason/original_doc/폴더에 넣기 - Codex에서 DocMason 폴더 열기
- 자연스럽게 질문하기 - DocMason이 환경 설정을 안내함
- 지식 베이스 구축 시 프롬프트 승인
경로 B (전체 폴더 준비):
- 부서 수준 폴더를
DocMason/original_doc/에 넣기 - Codex에서 열고 "DocMason 환경을 준비해 주세요."라고 말하기
- 그 다음: "지식 베이스를 구축해 주세요."라고 말하기
- 완료되면 전체 코퍼스에 대해 복잡한 연구 질문하기
이 시스템은 내부 명령어를 외울 필요 없이 유효한 작업 공간 내에서 AI 에이전트에게 자연스럽게 말하기만 하면 되도록 설계되었습니다.
기술적 세부사항
DocMason은 기존 문서 AI 도구의 특정 한계를 해결합니다:
- 슬라이드 덱에서 시각적 레이아웃, 발표자 노트, 차트-텍스트 관계 보존
- 스프레드시트에서 다중 시트 참조와 중첩 테이블 유지
- "위험"을 나타내는 빨간색 텍스트나 계층 구조를 위한 들여쓰기와 같은 서식 의미 보존
- 다중 부분 제안서에 대한 교차 문서 추론 가능
레포지토리 구조에는 어댑터, knowledge_base, runtime, skills, sample_corpus 디렉토리가 포함되어 있으며, 구성은 docmason.yaml과 pyproject.toml 파일을 통해 관리됩니다.
📖 전체 소스 읽기: HN AI Agents
👀 See Also

클로드 코드 UI 출력이 변질되는 이유와 구조화된 명세로 해결하는 방법
한 개발자가 Claude Code의 UI 출력이 일관되지 않은 것은 프롬프트 문제가 아니라 형식 문제라고 설명합니다. 정확한 16진수 색상 코드, 글꼴 두께, 간격, 화면 상태 및 전환을 제공하면 변화가 사라집니다. 또한 화면 녹화를 구조화된 명세서로 변환하는 MCP 서버를 오픈소스로 공개했습니다.

StarSteady: AI 기반 구글 리뷰 응답 및 지역 비즈니스를 위한 SMS 요청
StarSteady는 Google/Yelp 리뷰에 AI 생성 답변을 제공하고 고객에게 SMS 리뷰 요청을 보내는 개인 개발 SaaS로, 월 39달러부터 시작하며 5개의 답변과 5개의 SMS를 제공하는 무료 체험판이 있습니다.

PgAdmin 4 9.13, 쿼리 도구에 AI 어시스턴트 패널 추가
PgAdmin 4 버전 9.13은 AI가 구성된 경우 자연어에서 SQL을 생성할 수 있는 쿼리 도구 내 AI 어시스턴트 패널을 도입했습니다. 이 업데이트에는 방해 요소 없는 쿼리 편집을 위한 작업 공간 레이아웃과 임시 서버 연결 기능도 포함되어 있습니다.

Flue: 자율 코딩 에이전트 구축을 위한 TypeScript 프레임워크
Flue는 자율 에이전트 구축을 위한 프로그래머블 하네스를 제공하는 TypeScript 프레임워크로, 스킬, 세션, 샌드박스 셸 실행 및 내장 가상 샌드박스를 갖추고 있습니다. Dosu, Greptile, CodeRabbit, Devin, Claude Code 같은 도구를 사용자 정의 에이전트 로직으로 대체할 수 있습니다.