시각 기반 요약
텍스트 정보뿐만 아니라 이미지나 비디오와 같은 시각적 데이터를 핵심 근거로 삼아 내용을 요약하는 기술입니다. 에이전트가 환경의 시각적 변화를 정확히 인지하고 지식을 추출하는 데 중요한 역할을 합니다.