플래켓-루스
Plackett–Luce 모델은 K개 후보가 주어졌을 때, 순서에 따른 전체 가능성 분포를 정의하는 리스트와 순위 확률 모델이다. 이 논문의 listwise rollout에서 각 순서의 확률은 연쇄적 softmax로 분해되어 계산된다.