Создание пользовательской системы глоссария хинди с помощью Claude: от 76% до 92% точности за 10 месяцев

Разработчик-одиночка из Бангалора создал собственную систему глоссариев для Claude, чтобы повысить точность генерации контента на хинди в предметных областях. За 10 месяцев частота ошибок в отраслевой лексике снизилась с 24% до 8% (точность выросла с 76% до 92%). Сейчас проект обслуживает 310 клиентов с MRR в $10,8 тыс., предоставляя поддержку и контент для блогов на хинди.
Проблема: универсальный хинди для бизнес-терминов
Стандартные ответы Claude на хинди используют общеупотребительные переводы бизнес-терминов. Например, вместо «UPI bhugtan» (платеж через UPI) выводится просто «bhugtan» (платеж). Этот разрыв в предметной лексике приводил к 24% ошибок в специализированном контенте.
Эволюция системы глоссариев
Разработчик перепробовал три подхода в течение 10 месяцев:
- Месяцы 1–3: ручной глоссарий (200 терминов). Словарь вставлялся как контекст в каждый запрос. Точность выросла с 76% до 84%.
- Месяцы 4–6: структурированный глоссарий с категориями (400 терминов). Термины разбили по темам: налоги, платежи, комплаенс и бизнес-типы. Точность достигла 88%.
- Месяцы 7–10: глоссарий с примерами (600 терминов). Для каждого термина добавлено 2–3 предложения, показывающих правильное употребление в контексте. Точность поднялась до 92%.
Ключевые выводы для неанглийских AI-приложений
Разработчик подчеркивает, что глоссарий — это не просто список, а учебный инструмент. Простое увеличение количества терминов дало лишь незначительный эффект. Добавление категорий помогло, но наибольший прирост точности обеспечили примеры в контексте. Оставшиеся 8% ошибок в основном связаны с региональными вариациями и новыми регуляторными терминами.
Для разработчиков неанглийских AI-приложений этот кейс показывает, что в глоссарии лучше использовать предложения с примерами — они обучают модель контексту эффективнее, чем одни определения.
📖 Источник: r/ClaudeAI
👀 Смотрите также

Документация по написанию инструментов MCP на C# .NET Framework для Claude Desktop/Code
Полная документация и примеры кода на C# для создания пользовательских инструментов MCP с использованием .NET Framework 4.8, позволяющих Claude Desktop/Code автоматизировать взаимодействие с внешними процессами, программным обеспечением, API и устройствами IoT.

Исправление ошибок Claude Cowork «Не удалось запустить рабочее пространство» в Windows 11 Home
Пользователь решил ошибки запуска Claude Cowork в Windows 11 Home, установив Windows Subsystem for Linux (WSL2) из Microsoft Store, что необходимо для базовой технологии виртуальных машин.

Проблемы с установкой OpenClaw на Windows 11 для обычных пользователей
Любитель-энтузиаст описывает три конкретных препятствия при установке OpenClaw на мини-ПК за $200 под управлением Windows 11, включая политики выполнения PowerShell, блокировки Защитника Windows и отсутствие зависимостей, таких как Node.js и Git.

Практическая система выбора между моделями Claude: Haiku, Sonnet и Opus
Разработчик протестировал три модели Claude на задаче по рефакторингу Express.js объёмом 400 строк и обнаружил, что ключевое различие заключается в глубине рассуждений, а не в интеллекте. Haiku 4.5 справилась с простыми частями, но пропустила порядок промежуточного ПО, Sonnet 4.6 нашла проблему с порядком и добавила типы TypeScript, а Opus 4.6 выявила уязвимость безопасности в промежуточном ПО для аутентификации.