교차 학습
여러 작업을 순차적으로 끝내는 대신 번갈아 가며 조금씩 학습하는 방식이다. 데이터의 분포를 골고루 섞어 특정 데이터에 편향되거나 이전 지식을 잊는 것을 방지하려는 목적이다.
TD3 강화학습, 순차적 훈련이 동시 훈련보다 나을 수 있을까?