휴리스틱 필터
경험적인 규칙이나 통계적 기준을 사용하여 데이터의 품질을 판단하고 걸러내는 방식입니다. 예를 들어 줄 바꿈 빈도, 단어 길이, 특정 키워드(lorem ipsum 등) 포함 여부를 기준으로 노이즈를 제거합니다.