본문으로 건너뛰기
Gradient Accumulation: 적은 GPU 메모리로 큰 배치 사이즈 학습하기 | AI Trends