본문으로 건너뛰기
LK 손실: 추측 제어 디코딩을 위한 직접적 수락률 최적화 | AI Trends