언어 식별 모델
텍스트가 어떤 언어로 작성되었는지 판별하는 모델로, Meta의 fasttext 라이브러리에서 176개 언어를 지원한다. 데이터셋의 언어별 구성을 파악하고 필터링하는 데 사용된다.