Инструмент для реалистичной генерации реляционных БД

Инструмент решает проблему генерации баз данных для разработки приложений

Разработчик на r/ClaudeAI поделился своим решением распространённой проблемы при создании приложений с Claude Code: необходимостью в реалистичных, полностью загруженных реляционных базах данных для тестирования и демонстраций. Хотя запросы к Claude работали для небольших наборов данных, генерация более крупных наборов с сохранёнными связями внешних ключей становилась запутанной.

Технический подход, который сработал

Разработчик создал инструмент с несколькими ключевыми техническими подходами:

Топологическая генерация: Система разрешает граф зависимостей внешних ключей и генерирует таблицы в правильном порядке — сначала родительские таблицы, затем дочерние — причём каждый внешний ключ ссылается на реальную строку родительской таблицы.
Моделирование мощности связей: Вместо равномерных распределений генератор использует распределения, соответствующие реальным паттернам. Например, количество заказов на пользователя следует отрицательному биномиальному распределению, а временные метки активности группируются вокруг рабочих часов с реалистичными сезонными вариациями. Система выводит эти паттерны из структуры схемы и имён столбцов без необходимости настройки.
Согласованность между таблицами: Система обрабатывает неявные бизнес-правила, не объявленные как ограничения внешних ключей, например, гарантирует, что даты платежей идут после дат выставления счетов, или что отдел и зарплата сотрудника соответствуют его должности в соответствующей валюте. Эти правила выводятся из соглашений об именовании и связей между таблицами.
Схема из простого английского: Пользователи описывают, что им нужно (например, «SaaS-приложение с организациями, пользователями, проектами, задачами и журналом активности»), и инструмент строит полную схему со всеми связями, типами столбцов и ограничениями, а затем генерирует данные за один раз.

Контекст разработки

Разработчик отметил, что хотя приложение было написано с помощью Claude Code, сам движок генерации — часть, которая решает граф ограничений и моделирует распределения — пришлось проектировать вручную. Они обнаружили, что 100% зависимость от LLM для генерации таких данных недостаточно масштабируема и надёжна.

Разработчик сейчас работает над созданием MCP (Model Context Protocol) для работы с Claude.

📖 Read the full source: r/ClaudeAI

Разработчик создает инструмент для реалистичной генерации реляционных баз данных

Инструмент решает проблему генерации баз данных для разработки приложений

Технический подход, который сработал

Контекст разработки

👀 Смотрите также

Claude Code Ultracode Mode запускает 70-агентный конвейер для глубокого поиска

OpenClaw Nerve WebUI добавляет голосовое управление и панель управления командой.

Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу

Warp Terminal становится открытым исходным кодом с агентной средой разработки