CLVR
CLVR은 멀티모달 시각-언어 공간에서 목표를 달성하기 위해 Reason-Act-Reason의 순환 루프를 통해 추론과 이미지를 차례로 생성·수정하는 프레임워크이다. 데이터 합성부터 검증·정렬까지 시스템적 단계를 포함하며, 검증을 통해 잘못된 중간 단계가 누적되지 않도록 한다.