SDF 벤치마크
원문에서 사용된 평가용 벤치마크로, 다양한 organism과 모델 쌍을 포함해 파인튜닝 복원 성능을 측정하는 데이터셋 또는 평가 프로토콜이다. 복원 결과를 5점 척도로 평가해 방법별 성능을 비교했으며, 본문에서는 CDD와 ADL의 점수 차이를 이 벤치마크를 통해 보고했다. 벤치마크는 1B부터 32B 규모 모델까지를 포함한 실험 설계를 지원한다고 명시되었다.