autoregressive-model
이전 단계의 출력을 다음 단계의 입력으로 사용하여 순차적으로 데이터를 생성하는 방식이다. 현재 대부분의 LLM이 채택하고 있으나, 앞선 오류가 뒤로 전파되는 단점이 있다.
얀 르쿤이 강조하는 EBM, 토큰 단위 생성의 한계를 넘을 수 있을까?
14B 매개변수의 BiTDance 이미지 모델과 NVIDIA의 오픈소스 로봇 학습 도구 공개
"다음 토큰 예측은 한계인가?" 얀 르쿤이 제시한 에너지 기반 추론의 미래
2025년 AI 연구의 결정적 순간들과 코딩 에이전트의 진화