메모리 회상
에이전트가 과거의 상태나 경험을 저장하고 필요할 때 다시 불러와 현재의 의사결정에 반영하는 메커니즘이다. 장기적인 의존성이 필요한 복잡한 환경에서 필수적이다.
단일 작업을 넘어선 범용 에이전트 학습을 위한 RL 프레임워크 Multiverse 공개