NFKC 정규화
유니코드 문자를 호환성 및 정준 등가성에 따라 표준 형식으로 변환하는 과정이다. PDF 추출 시 발생하는 보이지 않는 유니코드 변이(ZWJ/ZWNJ 등)를 제거하여 검색 시 텍스트 일치율을 높이는 데 필수적이다.