부트스트랩 학습
학습 초기 단계에서 무작위 에피소드를 수집하여 에이전트가 환경에 대한 기초적인 정보를 얻도록 돕는 과정이다. 초기 데이터의 품질이 전체 학습 속도와 최종 성능에 큰 영향을 미친다.