코사인 어닐링
학습률을 코사인 함수의 반주기 곡선을 따라 최대치에서 최소치까지 서서히 낮추는 방식이다. 부드러운 감쇠 곡선을 통해 학습 후반부의 안정적인 수렴을 돕고, Chinchilla 등 주요 LLM 연구에서 표준적으로 사용되는 기법이다.