시각 캡셔닝 도구
이미지를 입력받아 그 내용을 상세한 텍스트 프롬프트로 변환해주는 도구이다. 고품질 이미지 생성을 위해 사람이 직접 작성하기 어려운 세밀한 묘사를 얻어낼 때 활용된다.