온라인 소프트맥스
전체 시퀀스 데이터를 한꺼번에 보지 않고도 부분적인 통계량(최댓값, 합계)을 순차적으로 업데이트하며 정확한 Softmax 값을 계산하는 알고리즘이다. 메모리 사용량을 줄이면서도 수학적으로 동일한 결과를 보장한다.