파라미터 수
모델 내부에서 학습되는 가중치의 총 개수로 모델의 크기와 복잡도를 결정한다. 파라미터가 적을수록 메모리 점유율이 낮아지고 추론 속도가 빨라져 엣지 기기나 CPU 환경에 유리하다.
4B 모델이 GPT-4o를 이겼다? Qwen 3.5의 놀라운 추상화 성능
Q2 양자화인데 30B 모델보다 좋다니? Qwen2.5-Coder의 놀라운 성능
YOLO보다 60배 작고 12배 빠른 테니스 공 추적 모델의 비밀