dense-model
모든 파라미터가 추론 과정에 참여하는 전통적인 신경망 구조이다. MoE 대비 연산량은 많으나 지능의 밀도가 높고 일관된 성능을 제공하는 경향이 있다.
27B 모델이 이정도? Qwen-3.5-27B로 1시간 만에 완성한 코딩 도구