Explore-then-Act 패러다임
목표 조건이 없는 자유로운 탐색 단계로 환경 지식을 grounded하게 확보한 뒤, 이후 목표 달성 단계에서 그 지식을 활용해 작업을 수행하는 추론-실행 파이프라인이다. 두 단계의 분리를 통해 탐색-활용 간의 원활한 연계를 가능하게 한다.