MC-AIXI-CTW
몬테카를로 트리 탐색(MCTS)과 컨텍스트 트리 가중치(CTW) 알고리즘을 결합하여 AIXI를 계산 가능하게 구현한 근사 모델이다. 환경의 모델을 학습하고 미래 보상을 예측하여 행동을 결정한다.