상태 표현
강화학습 에이전트가 의사결정을 내리기 위해 환경으로부터 관찰하는 데이터를 수치화하여 가공한 형태이다. 에이전트가 학습해야 할 정보의 질을 결정하며, 좌표계 변환을 통해 이 표현의 유의미성을 높이는 것이 학습 효율에 직접적인 영향을 미친다.