쿼드러플렛 형식
하나의 데이터 샘플을 생성 프롬프트, 이미지, 질문, 답변의 네 가지 요소로 구성한 데이터 구조이다. 모델이 이미지 생성과 시각적 이해를 동시에 학습할 수 있도록 하여 두 작업 간의 정렬 성능을 높이는 데 기여한다.