지각
AI가 이미지나 화면 스크린샷을 통해 시각적 정보를 이해하고 객체를 식별하는 능력이다. 컴퓨터 사용 기능에서 UI 요소를 정확히 파악하기 위한 핵심 기술이다.
Claude가 사람처럼 PC를 쓴다? Anthropic의 Vercept 인수와 AI 에이전트의 진화