맥락 인식 캡셔닝
단순히 이미지 속 물체를 나열하는 것을 넘어 인물 관계와 상황 정보를 조합해 문장 형태의 설명을 생성하는 기술이다. LLM을 활용해 '누가 누구와 무엇을 하고 있는지'를 자연어로 서술하여 검색 품질을 높인다.