캐니 에지 검출
이미지에서 강한 에지(경계)를 검출하는 알고리즘으로, 텍스트 영역은 많은 에지를 포함하므로 텍스트 밀집 구간을 찾는 힌트로 이용된다. 글에서는 페이지를 타일로 나눈 뒤 각 타일의 에지 밀도를 계산해 텍스트가 집중된 패치만 OCR로 처리함으로써 불필요한 연산을 줄였다. 에지 밀도는 스캔 품질과 문서 레이아웃에 따라 민감하게 변하므로 임계값 튜닝이 필요하다.