파라미터 크기
모델이 학습 과정에서 습득한 정보를 저장하는 매개변수의 총 개수이다. 일반적으로 파라미터 수가 많을수록 복잡한 추론이 가능하지만 더 많은 계산 자원과 비용이 소요된다.