본문으로 건너뛰기

grounded-interaction

그라운디드 상호작용

중급

에이전트가 화면의 실제 요소와 연계해 정확한 클릭, 입력, 탐색을 수행하는 능력으로, 시각적 상태와 행위를 일치시키는 것을 의미한다. GUI 에이전트의 성공률은 이러한 그라운디드 상호작용의 신뢰성에 크게 좌우되며 장기간 워크플로에서 취약점이 드러난다. 본 연구에서는 GUI의 한계를 그라운디드 상호작용의 장기적 안정성 관점에서 해석했다.