도파민 램핑
동물이 목표 지점에 가까워질수록 뇌 속의 도파민 수치가 점진적으로 상승하는 현상을 말한다. 기존 강화학습의 보상 예측 오류(RPE) 모델로는 설명하기 어려웠던 신경과학적 현상이다. 본 영상에서는 PT 프레임워크를 통해 이 현상을 이론적으로 설명할 수 있는 가능성을 제시한다.