본문으로 건너뛰기

corpus-augmentation

코퍼스 증강

중급

기존 텍스트 데이터셋을 전략적으로 변형하거나 확장하여 모델의 학습 범위를 넓히는 기법이다. 단순한 데이터 수집을 넘어 패러프레이징이나 데이터 변환을 통해 모델이 다양한 언어 패턴과 엣지 케이스를 학습하도록 유도한다.