Разработчик создает инструмент для реалистичной генерации реляционных баз данных

Инструмент решает проблему генерации баз данных для разработки приложений
Разработчик на r/ClaudeAI поделился своим решением распространённой проблемы при создании приложений с Claude Code: необходимостью в реалистичных, полностью загруженных реляционных базах данных для тестирования и демонстраций. Хотя запросы к Claude работали для небольших наборов данных, генерация более крупных наборов с сохранёнными связями внешних ключей становилась запутанной.
Технический подход, который сработал
Разработчик создал инструмент с несколькими ключевыми техническими подходами:
- Топологическая генерация: Система разрешает граф зависимостей внешних ключей и генерирует таблицы в правильном порядке — сначала родительские таблицы, затем дочерние — причём каждый внешний ключ ссылается на реальную строку родительской таблицы.
- Моделирование мощности связей: Вместо равномерных распределений генератор использует распределения, соответствующие реальным паттернам. Например, количество заказов на пользователя следует отрицательному биномиальному распределению, а временные метки активности группируются вокруг рабочих часов с реалистичными сезонными вариациями. Система выводит эти паттерны из структуры схемы и имён столбцов без необходимости настройки.
- Согласованность между таблицами: Система обрабатывает неявные бизнес-правила, не объявленные как ограничения внешних ключей, например, гарантирует, что даты платежей идут после дат выставления счетов, или что отдел и зарплата сотрудника соответствуют его должности в соответствующей валюте. Эти правила выводятся из соглашений об именовании и связей между таблицами.
- Схема из простого английского: Пользователи описывают, что им нужно (например, «SaaS-приложение с организациями, пользователями, проектами, задачами и журналом активности»), и инструмент строит полную схему со всеми связями, типами столбцов и ограничениями, а затем генерирует данные за один раз.
Контекст разработки
Разработчик отметил, что хотя приложение было написано с помощью Claude Code, сам движок генерации — часть, которая решает граф ограничений и моделирует распределения — пришлось проектировать вручную. Они обнаружили, что 100% зависимость от LLM для генерации таких данных недостаточно масштабируема и надёжна.
Разработчик сейчас работает над созданием MCP (Model Context Protocol) для работы с Claude.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Qwen 3.6 27B с MTP на V100 32GB: 54 т/с через ветку llama.cpp
Ветка MTP от am17an для llama.cc запускает Qwen 3.6 27B со скоростью 54 т/с на V100 32GB через адаптер PCIe, падая до 29-30 т/с без MTP.
LTM: Протокол JSON для портативной памяти агентов между моделями и машинами
LTM — это JSON-протокол (Core Memory Packet) плюс CLI/сервер для сохранения контекста агента — тупиков, ограничений, следующих шагов — между моделями, редакторами и машинами. Пакеты размером 2–5 КБ, скрывают секреты и поддерживают MCP.

Toroidal Logit Bias: простой трюк на инференсе снижает галлюцинации на 40%
Новый метод отображает токены на тор и усиливает близкие логиты, снижая фактические ошибки без файнтюнинга или RAG.

FOMOE позволяет запускать вывод модели Qwen3.5 на 397 миллиардов параметров на настольном оборудовании стоимостью $2100.
FOMOE (Fast Opportunistic Mixture of Experts) позволяет запускать флагманскую модель Qwen3.5 с 397 миллиардами параметров со скоростью 5-9 токенов/сек на потребительском оборудовании с использованием двух видеокарт за $500, 32 ГБ ОЗУ и накопителя NVMe с квантованием Q4_K_M.