보컬 스템
음악 믹싱에서 악기 소리를 제외하고 보컬 트랙만 따로 추출한 오디오 파일을 의미한다. AI가 가창 시점을 정확히 파악하여 화면을 전환하는 기준으로 활용되며, 노래하는 장면과 배경 장면을 구분하는 핵심 데이터로 쓰인다.