Granite 4.1 3B SVG 펠리컨 갤러리

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

IBM이 최근 공개한 오픈 소스 모델 Granite 4.1 제품군 중 3B 모델을 대상으로 양자화 수준에 따른 성능 차이를 실험했다. Unsloth가 공개한 21종의 GGUF 양자화 파일들을 활용하여 '자전거를 타는 펠리컨'이라는 동일한 SVG 생성 프롬프트를 실행했다. 실험 결과 모델의 크기가 1.2GB에서 6.34GB까지 다양함에도 불구하고 생성된 이미지의 품질과 모델 크기 사이의 명확한 상관관계는 발견되지 않았다. 모든 양자화 버전에서 생성된 결과물이 기대에 미치지 못하는 수준임을 확인하며 향후 더 뛰어난 모델로 재실험할 가능성을 시사했다.

배경

LLM 양자화(Quantization) 개념, GGUF 파일 형식에 대한 이해, SVG(Scalable Vector Graphics) 기초 지식

대상 독자

LLM 양자화 성능 차이에 관심 있는 개발자 및 AI 실험가

의미 / 영향

이 실험은 소형 모델의 양자화가 특정 창의적 작업(SVG 생성)에서 선형적인 성능 향상을 보장하지 않음을 시사합니다. 개발자들은 모델 선택 시 단순히 파라미터 수나 양자화 비트 수에 의존하기보다 실제 유즈케이스에 대한 벤치마크가 중요함을 인지해야 합니다.

섹션별 상세

IBM은 Apache 2.0 라이선스로 3B, 8B, 30B 크기의 Granite 4.1 모델 제품군을 새롭게 출시했다. 이 모델들은 오픈 소스로 공개되어 다양한 환경에서 자유롭게 활용이 가능하다. 특히 소형 모델인 3B 버전은 효율적인 추론이 필요한 환경을 타겟으로 한다.

Unsloth는 Granite 4.1 3B 모델을 21가지의 서로 다른 GGUF 양자화 버전으로 변환하여 공개했다. 파일 크기는 최소 1.2GB에서 최대 6.34GB에 이르며 전체 파일의 합계는 51.3GB에 달한다. 이는 사용자가 하드웨어 자원에 맞춰 최적의 양자화 수준을 선택할 수 있는 폭을 넓혀준다.

동일한 프롬프트인 '자전거를 타는 펠리컨의 SVG 생성'을 모든 양자화 버전에 입력하여 출력값을 비교했다. 텍스트 기반의 SVG 코드를 생성하게 함으로써 모델의 논리적 구조 이해와 시각적 표현 능력을 동시에 테스트하고자 했다. 하지만 결과물은 대부분 추상적인 도형의 집합에 그쳤다.

실험 결과 모델의 파일 크기와 생성된 이미지의 품질 사이에는 유의미한 패턴이 나타나지 않았다. 가장 작은 모델이 오히려 자전거 형태를 더 잘 묘사하거나 가장 큰 모델이 펠리컨과 유사한 형태를 만드는 등 일관성이 부족했다. 이는 특정 크기 이상의 양자화가 이미지 생성 능력에 결정적인 영향을 주지 못했음을 의미한다.

Granite 4.1 3B 모델의 6가지 양자화 버전이 생성한 SVG 이미지 결과물 비교표 — Screenshot1.2GB부터 1.67GB까지 다양한 크기의 양자화 모델들이 생성한 이미지를 나열하여 보여줍니다. 수치상으로는 모델 크기가 커져도 시각적 품질이 개선되지 않으며, 오히려 가장 작은 모델(#21)이 자전거 형태를 더 명확히 표현하는 역설적인 결과를 시각적으로 증명합니다.

실무 Takeaway

소형 LLM(3B)의 경우 양자화 수준을 높여 파일 크기를 키우더라도 복잡한 SVG 생성 능력에서 드라마틱한 품질 향상을 기대하기 어렵다.
Unsloth에서 제공하는 다양한 GGUF 양자화 옵션은 성능 최적화 실험을 위한 훌륭한 리소스가 되지만 모델 자체의 기본 성능 한계를 넘어서지는 못한다.
특정 도메인(이미지 코드 생성 등)의 성능을 평가할 때는 양자화 변수보다 모델 아키텍처나 학습 데이터의 특성이 더 지배적인 영향을 미친다.

언급된 리소스

GitHubunsloth/granite-4.1-3b-GGUF