코드 혼합
화자가 대화 중에 두 개 이상의 언어나 방언을 섞어서 사용하는 현상을 말한다. 힌글리시(Hinglish)처럼 힌디어와 영어가 혼용되는 언어 모델 학습에서 구현하기 까다로운 핵심 요소이다.