인과 언어 모델링
CLM은 시퀀스의 순차적 조건부 확률 p(x1, x2, ..., xT)=∏ p(xt|x1...x(t-1))를 학습하는 방식이다. 본 연구는 도메인 적응에서 MLM의 대안으로 CLM detour를 평가한다.