long-horizon-planning
복잡하고 긴 단계가 필요한 목표를 달성하기 위해 일련의 행동을 미리 설계하고 관리하는 능력이다. 에이전트가 단기적 과제를 넘어 프로젝트 단위의 업무를 수행하는 핵심 기술이다.
VLM의 한계 돌파: 물리적 제약을 이해하는 상호작용형 3D 벤치마크 CHAIN 공개
SOTA 에이전트도 성공률 20% 미만, 장기적 CLI 프로그래밍의 한계
정적 벤치마크의 종말, 이제는 자율 실행 에이전트의 시대
NVIDIA의 새로운 3B 추론 모델, Together AI에서 에이전트 성능 극대화