자동 미분 그래프
연산 과정을 기록하여 역전파(Backpropagation) 시 그래디언트를 자동으로 계산하기 위한 데이터 구조이다. 모든 중간 연산 결과와 파라미터 참조를 메모리에 유지해야 하므로 대규모 모델에서는 막대한 메모리 오버헤드를 발생시킨다.