본문으로 건너뛰기

causal-tokenization

인과적 토큰화

중급

데이터 시퀀스에서 현재 토큰이 오직 이전 토큰들에만 의존하도록 순서를 부여하는 방식이다. 언어 모델의 다음 단어 예측과 같은 원리로, 이미지 데이터를 1차원 순서로 배열하여 자기회귀 모델이 학습하기 적합한 구조를 만든다.