블로킹 전략
수백만 개의 레코드를 서로 모두 비교하는 대신, 유사할 가능성이 높은 그룹으로 미리 나누어 비교 횟수를 획기적으로 줄이는 기법이다. 연산 복잡도를 O(N^2)에서 선형에 가깝게 줄여 대규모 데이터 처리를 가능하게 한다.