Gradient-Guided Adaptive Sampling
각 태스크의 학습 난이도를 gradient_norm으로 추정하고, 데이터 규모를 보정해 샘플링 확률을 동적으로 재조정하는 샘플링 전략이다.