Создание пользовательской системы глоссария хинди с помощью Claude: от 76% до 92% точности за 10 месяцев

✍️ OpenClawRadar📅 Опубликовано: 3 июня 2026 г.🔗 Source
Создание пользовательской системы глоссария хинди с помощью Claude: от 76% до 92% точности за 10 месяцев
Ad

Разработчик-одиночка из Бангалора создал собственную систему глоссариев для Claude, чтобы повысить точность генерации контента на хинди в предметных областях. За 10 месяцев частота ошибок в отраслевой лексике снизилась с 24% до 8% (точность выросла с 76% до 92%). Сейчас проект обслуживает 310 клиентов с MRR в $10,8 тыс., предоставляя поддержку и контент для блогов на хинди.

Проблема: универсальный хинди для бизнес-терминов

Стандартные ответы Claude на хинди используют общеупотребительные переводы бизнес-терминов. Например, вместо «UPI bhugtan» (платеж через UPI) выводится просто «bhugtan» (платеж). Этот разрыв в предметной лексике приводил к 24% ошибок в специализированном контенте.

Эволюция системы глоссариев

Разработчик перепробовал три подхода в течение 10 месяцев:

  • Месяцы 1–3: ручной глоссарий (200 терминов). Словарь вставлялся как контекст в каждый запрос. Точность выросла с 76% до 84%.
  • Месяцы 4–6: структурированный глоссарий с категориями (400 терминов). Термины разбили по темам: налоги, платежи, комплаенс и бизнес-типы. Точность достигла 88%.
  • Месяцы 7–10: глоссарий с примерами (600 терминов). Для каждого термина добавлено 2–3 предложения, показывающих правильное употребление в контексте. Точность поднялась до 92%.
Ad

Ключевые выводы для неанглийских AI-приложений

Разработчик подчеркивает, что глоссарий — это не просто список, а учебный инструмент. Простое увеличение количества терминов дало лишь незначительный эффект. Добавление категорий помогло, но наибольший прирост точности обеспечили примеры в контексте. Оставшиеся 8% ошибок в основном связаны с региональными вариациями и новыми регуляторными терминами.

Для разработчиков неанглийских AI-приложений этот кейс показывает, что в глоссарии лучше использовать предложения с примерами — они обучают модель контексту эффективнее, чем одни определения.

📖 Источник: r/ClaudeAI

Ad

👀 Смотрите также

Документация по написанию инструментов MCP на C# .NET Framework для Claude Desktop/Code
Гайды

Документация по написанию инструментов MCP на C# .NET Framework для Claude Desktop/Code

Полная документация и примеры кода на C# для создания пользовательских инструментов MCP с использованием .NET Framework 4.8, позволяющих Claude Desktop/Code автоматизировать взаимодействие с внешними процессами, программным обеспечением, API и устройствами IoT.

OpenClawRadar
Исправление ошибок Claude Cowork «Не удалось запустить рабочее пространство» в Windows 11 Home
Гайды

Исправление ошибок Claude Cowork «Не удалось запустить рабочее пространство» в Windows 11 Home

Пользователь решил ошибки запуска Claude Cowork в Windows 11 Home, установив Windows Subsystem for Linux (WSL2) из Microsoft Store, что необходимо для базовой технологии виртуальных машин.

OpenClawRadar
Проблемы с установкой OpenClaw на Windows 11 для обычных пользователей
Гайды

Проблемы с установкой OpenClaw на Windows 11 для обычных пользователей

Любитель-энтузиаст описывает три конкретных препятствия при установке OpenClaw на мини-ПК за $200 под управлением Windows 11, включая политики выполнения PowerShell, блокировки Защитника Windows и отсутствие зависимостей, таких как Node.js и Git.

OpenClawRadar
Практическая система выбора между моделями Claude: Haiku, Sonnet и Opus
Гайды

Практическая система выбора между моделями Claude: Haiku, Sonnet и Opus

Разработчик протестировал три модели Claude на задаче по рефакторингу Express.js объёмом 400 строк и обнаружил, что ключевое различие заключается в глубине рассуждений, а не в интеллекте. Haiku 4.5 справилась с простыми частями, но пропустила порядок промежуточного ПО, Sonnet 4.6 нашла проблему с порядком и добавила типы TypeScript, а Opus 4.6 выявила уязвимость безопасности в промежуточном ПО для аутентификации.

OpenClawRadar