vla
시각 정보(Vision)와 언어(Language)를 결합하여 로봇의 구체적인 물리적 행동(Action)을 결정하는 멀티모달 AI 모델로 로보틱스의 핵심 기술이다.
월 6TB 데이터와 A6000 한 대로 시작하는 ML 인프라 구축, 커리어에 도움 될까?
12가지 설계 원칙으로 로봇 제어의 한계를 넘다, VLANeXt 공개