Claude 힌디어 용어집: 10개월 만에 정확도 76%→92%

방갈로르의 독립 개발자가 Claude를 위한 맞춤 용어집 시스템을 구축하여 힌디어 도메인 특화 콘텐츠 생성의 정확도를 높였습니다. 10개월 동안 도메인 어휘 오류율이 24%에서 8%로 감소했습니다(정확도는 76%에서 92%로 향상). 이 프로젝트는 현재 힌디어 고객 지원 및 블로그 콘텐츠를 위해 310명의 고객에게 월 10,800달러의 MRR로 서비스를 제공하고 있습니다.

문제: 비즈니스 용어에 대한 일반 힌디어

Claude의 기본 힌디어는 비즈니스 용어에 대해 일반 번역을 사용합니다. 예를 들어, "UPI bhugtan"(UPI 결제) 대신 "bhugtan"(결제)을 출력합니다. 이러한 도메인 어휘 격차로 인해 전문 콘텐츠에서 24%의 오류율이 발생했습니다.

용어집 시스템의 진화

개발자는 10개월 동안 세 가지 접근법을 반복했습니다:

1~3개월: 수동 용어집(200개 용어). 모든 쿼리마다 문맥으로 붙여넣었습니다. 정확도가 76%에서 84%로 향상되었습니다.
4~6개월: 카테고리별 구조화된 용어집(400개 용어). 용어를 세금, 결제, 규정 준수, 비즈니스 유형으로 구성했습니다. 정확도가 84%에서 88%로 향상되었습니다.
7~10개월: 예시 기반 용어집(600개 용어). 각 용어에 올바른 사용법을 보여주는 2~3개의 예문이 포함됩니다. 정확도가 92%에 도달했습니다.

비영어권 AI 애플리케이션을 위한 핵심 시사점

개발자는 용어집이 단순한 목록이 아니라 교육 도구라고 강조합니다. 단순히 용어 수를 늘리는 것은 한계가 있었습니다. 분류는 가치를 더했지만, 문맥이 있는 예문이 정확도 향상에 가장 큰 영향을 미쳤습니다. 남은 8%의 오류율은 지역 변형과 새로 도입된 규제 용어에 집중되어 있습니다.

비영어권 AI 애플리케이션을 구축하는 개발자에게 이 사례 연구는 용어집이 정의만으로 모델에 맥락을 가르치는 것보다 예문을 포함해야 함을 보여줍니다.

📖 전체 출처 읽기: r/ClaudeAI