적응형 그래디언트 클리핑
2025년 2월에 발표된 최신 논문에서 제안된 기법이다. 학습 과정에서 그래디언트의 크기를 상황에 맞게 동적으로 조절하여 모델의 수렴 속도와 안정성을 개선하는 데 기여하며, Claude의 기존 학습 데이터에는 포함되지 않은 최신 기술이다.