ETL-D MCP-сервер: Детерминированный парсинг CSV для Claude, предотвращающий финансовые галлюцинации

✍️ OpenClawRadar📅 Опубликовано: 25 марта 2026 г.🔗 Source
ETL-D MCP-сервер: Детерминированный парсинг CSV для Claude, предотвращающий финансовые галлюцинации
Ad

Разработчик опубликовал с открытым исходным кодом ETL-D — сервер MCP для Claude Desktop, предназначенный для предотвращения галлюцинаций Claude с десятичными точками при разборе финансовых CSV-файлов и других структурированных форматов B2B-данных. Инструмент решает проблему «налога на токены» при отправке сырых форматов в контекстное окно LLM и «риска галлюцинаций», когда неправильно поставленные запятые могут превратить $100.50 в $10,050.00.

Архитектура: трёхуровневый водопад

Сервер обрабатывает файлы через три строгих уровня, когда Claude просят их разобрать:

  • Уровень 1 (Эвристика): Использует 100% Python с regex, dateutil и строгими структурными парсерами для известных форматов. Разработчик сообщает о нагрузочном тесте с 200 параллельными запросами, достигающем времени отклика ~70 мс при 0 вызовах LLM и нулевом риске галлюцинаций.
  • Уровень 2 (Семантическая маршрутизация): Если заголовки CSV зашифрованы, лёгкий маршрутизатор сопоставляет столбцы со строгими схемами Pydantic.
  • Уровень 3 (Резервный LLM): Срабатывает только для «свободного текста» с высокой энтропией, используя под капотом Llama 3.3 70b для применения JSON-схем.

Результатом является идеально чистый, сглаженный JSON-массив, возвращаемый Claude для анализа.

Ad

Установка и доступность

Инструмент одобрен в официальном реестре MCP Anthropic. Чтобы использовать его, разработчикам необходимо настроить свой claude_desktop_config.json. Исходный код доступен на GitHub по адресу pablixnieto2/etld-mcp-server.

Разработчик создал это после того, как выяснил, что «LLM-первый подход» — неправильная архитектура для структурированных B2B-данных, таких как истории сделок брокеров, банковские выписки (Norma 43) или файлы SEC XBRL, утверждая, что ИИ-агенты не должны читать CSV-файлы напрямую, а должны запрашивать детерминированное промежуточное ПО.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

🦀
Инструменты

Needle: 26-миллионная параметрическая модель вызова функций, работающая со скоростью 6000 токенов/с на мобильных устройствах

Cactus выпускает с открытым исходным кодом модель Needle с 26 млн параметров для однократного вызова функций, достигающую 6000 ток/с префилла и 1200 ток/с декодинга на пользовательских устройствах. Построенная на Simple Attention Networks (без FFN), она превосходит несколько более крупных моделей в бенчмарках использования инструментов.

OpenClawRadar
PixelCheck: npm-пакет, позволяющий ИИ-агентам визуально проверять веб-страницы
Инструменты

PixelCheck: npm-пакет, позволяющий ИИ-агентам визуально проверять веб-страницы

PixelCheck — это npm-пакет, который позволяет AI-агентам открывать, взаимодействовать и визуально оценивать веб-страницы — больше никаких ручных циклов со скриншотами и обратной связью.

OpenClawRadar
Пользовательская строка состояния для Claude Code: отображение использования контекста, лимитов запросов и количества токенов на первый взгляд
Инструменты

Пользовательская строка состояния для Claude Code: отображение использования контекста, лимитов запросов и количества токенов на первый взгляд

Пользовательский скрипт добавляет постоянную строку состояния в Claude Code, отображающую процент использования контекста, лимит 5-часовой ставки в процентах, чтения KV-кэша, общее количество входных/выходных токенов, имя модели и рабочую директорию — с цветовой кодировкой для тёмных терминалов.

OpenClawRadar
Klaw.sh: Оркестрация в стиле Kubernetes для ИИ-агентов
Инструменты

Klaw.sh: Оркестрация в стиле Kubernetes для ИИ-агентов

Klaw.sh предлагает решение для оркестрации развертывания ИИ-агентов, основанное на Kubernetes. Оно упрощает управление с помощью кластеров, пространств имен и каналов, достигая сокращения памяти, переписывая код с Node.js на Go.

OpenClawRadar