의미적 텍스트 유사도
두 텍스트가 의미적으로 얼마나 유사한지를 수치화하는 기법이다. LongTracer에서는 bi-encoder를 사용하여 수많은 소스 문장 중 검증할 주장과 가장 관련성이 높은 문장을 빠르게 검색하는 데 활용된다. 대규모 데이터셋에서 효율적인 후보군 추출을 가능하게 한다.