CLIP 유사도
텍스트와 이미지 간의 의미적 유사성을 수치화하는 지표이다. CLIP 모델을 통해 텍스트 프롬프트와 생성된 이미지(캔버스)를 동일한 벡터 공간에 투영한 후, 두 벡터 사이의 거리를 측정하여 보상 신호로 활용한다.