다중 암드 밴딧
여러 선택지(암) 중 보상을 최대화하기 위해 탐색과 활용의 균형을 맞추는 확률적 최적화 문제이다. 각 선택지의 보상 확률 분포를 모르는 상태에서 최적의 선택을 찾는 것이 핵심이다.
성능 미달 암은 가라! 효율적인 우수 암 식별 알고리즘 APGAI 공개