본문으로 건너뛰기
구멍 메우기: 다국어 번역을 위한 강화학습에서의 리워드 해킹 완화 | AI Trends