시계열 데이터 분할 (time-series-data-splitting) 용어 설명 | AI Trends
time-series-data-splitting
시계열 데이터 분할
고급
시계열 데이터의 시간적 순서를 보존하며 학습용과 테스트용 데이터를 나누는 기법이다. 무작위 분할 시 미래의 정보가 과거의 학습 데이터에 포함되어 모델 성능이 과장되는 데이터 누수 문제를 방지한다. 금융이나 기상 예측처럼 순서가 중요한 도메인에서 모델의 실제 예측 능력을 정확히 평가하기 위해 반드시 적용해야 하는 필수적인 데이터 처리 방식이다.