상태 전이
시스템이 한 상태에서 다른 상태로 변화하는 과정이다. AI 학습에서는 특정 상황에서 가장 효율적이거나 보상이 높은 행동을 선택하는 과정을 뜻한다.
AI가 공감을 흉내 내는 대신, 관계의 안정성을 최적 전략으로 학습한다면?