적대적 후회
온라인 학습에서 알고리즘이 내린 결정의 누적 손실과 사후적으로 가장 좋았던 고정된 선택의 누적 손실 차이를 의미한다. 이는 불확실한 환경에서 알고리즘이 얼마나 최적에 가까운 성능을 냈는지 측정하는 지표로, 하위 선형적 증가 시 장기적으로 최적 전략에 수렴함을 보장한다.