본문으로 건너뛰기
미러 디센트를 이용한 어텐션 최적화: 일반화된 최대 마진 토큰 선택 | AI Trends