래스터화
벡터나 페이지 형식의 문서를 픽셀 이미지로 변환하는 처리로, OCR 전처리에서 해상도와 세부 정보에 영향을 준다. 이 글에서는 PyMuPDF로 페이지를 2배 확대해 래스터화하여 작은 글자나 스캔 잡음에서 텍스트 증거를 더 명확하게 만드는 용도로 사용되었다. 래스터화 결과의 해상도는 에지 기반 패치 선택과 OCR 인식 신뢰도에 직접적인 영향을 준다.