stochastic-gradient-descent
데이터의 일부(미니배치)만을 사용하여 경사도를 계산하고 파라미터를 업데이트하는 최적화 알고리즘이다. 전체 데이터를 사용하는 것보다 계산 비용이 적고 지역 최솟값을 탈출하는 데 유리하여 딥러닝 학습의 핵심 기술로 사용된다.
데이터의 일부(미니배치)만을 사용하여 경사도를 계산하고 파라미터를 업데이트하는 최적화 알고리즘이다. 전체 데이터를 사용하는 것보다 계산 비용이 적고 지역 최솟값을 탈출하는 데 유리하여 딥러닝 학습의 핵심 기술로 사용된다.