제곱근 스케일링 법칙
배치 사이즈를 변경할 때 학습률을 배치 사이즈 변화량의 제곱근에 비례하여 조정하는 규칙이다. 대규모 모델 학습 시 안정적인 수렴을 돕는 핵심 하이퍼파라미터 조정 기법이다.