stochastic-bandits
각 선택지(암)의 보상이 특정 확률 분포를 따르는 문제 설정으로, 제한된 기회 내에서 탐색과 활용의 균형을 맞추며 보상을 극대화하는 것이 핵심이다.
성능 미달 선택지는 거른다! 효율적인 우수 암 식별 알고리즘 APGAI