인도어군
힌디어, 벵골어 등 인도 아대륙에서 사용되는 언어들의 총칭이다. 언어적 구조가 복잡하고 데이터가 부족한 경우가 많아, LLM의 성능을 높이기 위해서는 현지 맥락이 반영된 고품질 학습 데이터셋 구축이 필수적이다.