생성 흐름 네트워크
다양한 고보상 샘플을 보상에 비례하는 확률로 생성하도록 학습하는 확률적 모델링 기법입니다. 단일 최적해만 찾는 대신 보상 공간 전체를 탐색하여 결과물의 다양성을 확보하는 데 중요합니다.