thompson-sampling
톰슨 샘플링
다중 슬롯 머신 문제(Multi-Armed Bandit)를 해결하기 위한 베이즈 확률 기반 알고리즘이다. 각 모델의 성능을 확률 분포로 모델링하고, 탐색(Exploration)과 활용(Exploitation)의 균형을 맞추어 실시간으로 최적의 라우팅 대상을 학습하는 데 사용된다.
톰슨 샘플링
다중 슬롯 머신 문제(Multi-Armed Bandit)를 해결하기 위한 베이즈 확률 기반 알고리즘이다. 각 모델의 성능을 확률 분포로 모델링하고, 탐색(Exploration)과 활용(Exploitation)의 균형을 맞추어 실시간으로 최적의 라우팅 대상을 학습하는 데 사용된다.