스태켈버그 부분 관측 마르코프 결정 과정
리더(사용자)와 팔로워(에이전트)가 순차적으로 의사결정을 내리는 게임 이론적 구조에 불확실한 환경 정보를 결합한 모델이다. 사용자의 행동을 보고 에이전트가 최적의 개입 시점을 결정하는 복잡한 상호작용을 수학적으로 정의한다.