온라인 강화학습
모델이 생성한 결과물에 대해 즉각적인 피드백을 받아 실시간으로 성능을 개선하는 학습 방식으로, 복잡한 공간 구도 생성을 최적화하는 데 사용된다.
8만 개 데이터로 학습한 SpatialScore, 상용 모델 능가하는 공간 지능