revenue-regret
최적의 전략을 미리 알고 있었을 때 얻을 수 있는 최대 수익과 실제 알고리즘이 달성한 수익 사이의 차이를 의미한다. 이 값이 작을수록 알고리즘이 최적 성능에 빠르게 수렴함을 나타낸다.
부정직한 입찰자도 막는다! 강화학습 기반 경매 최적화 알고리즘 CLUB 공개