VOICES-IN-THE-WILD-2M
7가지 메타 시나리오와 54개의 합성 시나리오를 포함하는 대규모 음향 데이터셋으로, 2.4M 샘플과 11k 시간 분량을 가지며 원시-합성 데이터의 혼합 환경을 시뮬레이션한다.