상한 신뢰 구간
불확실성을 고려하여 탐색과 활용의 균형을 맞추는 알고리즘이다. 과거에 잘 작동했던 선택지(활용)와 아직 충분히 시도되지 않은 선택지(탐색) 사이에서 최적의 결정을 내리도록 돕는다.