행동 기반 클러스터링
생성된 여러 답변 후보들을 단순히 텍스트 일치 여부가 아니라, 실제 실행 결과나 출력의 논리적 동등성을 기준으로 그룹화하는 기법입니다. 서로 다른 코드 문법이라도 같은 결과를 내면 동일한 클러스터로 묶어 신뢰도를 측정합니다.