Глоссарий Claude для хинди: точность с 76% до 92% за 10 месяцев

Разработчик-одиночка из Бангалора создал собственную систему глоссариев для Claude, чтобы повысить точность генерации контента на хинди в предметных областях. За 10 месяцев частота ошибок в отраслевой лексике снизилась с 24% до 8% (точность выросла с 76% до 92%). Сейчас проект обслуживает 310 клиентов с MRR в $10,8 тыс., предоставляя поддержку и контент для блогов на хинди.

Проблема: универсальный хинди для бизнес-терминов

Стандартные ответы Claude на хинди используют общеупотребительные переводы бизнес-терминов. Например, вместо «UPI bhugtan» (платеж через UPI) выводится просто «bhugtan» (платеж). Этот разрыв в предметной лексике приводил к 24% ошибок в специализированном контенте.

Эволюция системы глоссариев

Разработчик перепробовал три подхода в течение 10 месяцев:

Месяцы 1–3: ручной глоссарий (200 терминов). Словарь вставлялся как контекст в каждый запрос. Точность выросла с 76% до 84%.
Месяцы 4–6: структурированный глоссарий с категориями (400 терминов). Термины разбили по темам: налоги, платежи, комплаенс и бизнес-типы. Точность достигла 88%.
Месяцы 7–10: глоссарий с примерами (600 терминов). Для каждого термина добавлено 2–3 предложения, показывающих правильное употребление в контексте. Точность поднялась до 92%.

Ключевые выводы для неанглийских AI-приложений

Разработчик подчеркивает, что глоссарий — это не просто список, а учебный инструмент. Простое увеличение количества терминов дало лишь незначительный эффект. Добавление категорий помогло, но наибольший прирост точности обеспечили примеры в контексте. Оставшиеся 8% ошибок в основном связаны с региональными вариациями и новыми регуляторными терминами.

Для разработчиков неанглийских AI-приложений этот кейс показывает, что в глоссарии лучше использовать предложения с примерами — они обучают модель контексту эффективнее, чем одни определения.

📖 Источник: r/ClaudeAI

Создание пользовательской системы глоссария хинди с помощью Claude: от 76% до 92% точности за 10 месяцев

Проблема: универсальный хинди для бизнес-терминов

Эволюция системы глоссариев

Ключевые выводы для неанглийских AI-приложений

👀 Смотрите также

Оптимизация настройки OpenClaw: Практические шаблоны и идеи

Автоматизация обновления OAuth-токенов для ботов с использованием Claude Code

Понимание архитектуры ИИ-агентов: Детерминированные и вероятностные слои

Руководство по автоматизации поиска работы с OpenClaw — Настройки, Cron-задачи и фильтрация