counterfactual-reasoning
'만약 다른 행동을 했다면 결과가 어땠을까?'라는 질문에 답하는 추론 방식이다. 강화학습에서는 과거의 경험을 바탕으로 가상의 시나리오를 시뮬레이션하여 정책을 개선하거나 오프라인 데이터에서 학습할 때 유용하게 사용된다.
'만약 다른 행동을 했다면 결과가 어땠을까?'라는 질문에 답하는 추론 방식이다. 강화학습에서는 과거의 경험을 바탕으로 가상의 시나리오를 시뮬레이션하여 정책을 개선하거나 오프라인 데이터에서 학습할 때 유용하게 사용된다.