orbital-dynamics
중력의 영향을 받는 천체나 인공 물체의 운동을 다루는 물리 법칙이다. 강화학습 환경에서는 에이전트가 학습해야 할 복잡한 비선형 물리 법칙으로 작용한다.
수학적으로 완벽한 환경인데 왜 RL 모델은 80%에서 멈출까요?