본문으로 건너뛰기
Mirror Descent를 이용한 Attention 최적화: 일반화된 최대 마진 토큰 선택 | AI Trends