DOM 노드 스코어링
HTML 문서 구조 내의 각 요소(Node)에 대해 텍스트 밀도, 시맨틱 태그의 중요도, 링크 비율 등을 계산하여 점수를 부여하는 기법이다. 이를 통해 광고나 메뉴 같은 노이즈를 걸러내고 실제 본문 내용에 해당하는 핵심 콘텐츠를 식별하여 추출할 수 있다.