활성화 체크포인팅
학습 시 역전파를 위해 모든 층의 활성화 값을 저장하는 대신, 일부만 저장하고 나머지는 필요할 때 다시 계산하여 메모리 사용량을 줄이는 기법입니다. 메모리와 연산 시간 사이의 트레이드오프를 활용합니다.