친칠라 법칙
모델의 파라미터 수와 학습 데이터 토큰 수 사이의 최적 비율을 정의한 법칙입니다. 모델 크기와 학습량이 균형을 이룰 때 가장 효율적인 성능을 낸다는 원리로, 효율적인 모델 학습 설계의 기준이 됩니다.