화자 식별
대화형 데이터에서 각 발언이 누구에 의해 작성되었는지 정확히 할당하는 작업이다. 이메일 스레드가 평면화되면 대명사 '나'가 지칭하는 대상이 섞여 업무 담당자를 잘못 지정하는 치명적 오류가 발생한다.