Cross-Entropy Method
CEM은 확률적 최적화 기법으로 샘플링 기반으로 후보 액션을 생성하고 하위 성능 샘플에 맞춰 분포를 갱신하는 반복 절차이다. 본 논문에서는 목표 잠재와의 거리로 후보를 평가하며 CEM이 많은 후보를 평가하므로 각 후보 평가 비용이 전체 계획 시간에 큰 영향을 미친다. Fast-LeWM은 후보 평가 당 동적 모듈 호출 횟수를 줄여 CEM 기반 계획 비용을 감소시켰다.