업샘플링
데이터셋 내에서 비중이 적은 클래스나 언어의 샘플을 복제하여 학습 데이터의 균형을 맞추는 기법이다. 이를 통해 모델이 데이터가 많은 특정 항목에만 편향되는 것을 방지하고, 소수 데이터에 대한 학습 강도를 높여 전체적인 성능 균형을 달성한다.