IBM, AI 모델을 소프트웨어처럼 모듈화하는 '생성형 컴퓨팅'과 Granite 4.1 공개

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

IBM Research는 AI 모델을 소프트웨어처럼 모듈화하여 재사용 가능한 빌딩 블록으로 구성하는 '생성형 컴퓨팅(Generative Computing)' 접근 방식을 도입했다. 이 방식은 Granite 4.1 모델에 Granite Libraries의 어댑터 함수를 결합하여 특정 작업을 수행하는 구조이다. Project Granite Switch는 이러한 어댑터를 동적으로 전환하여 추론 효율성을 높이는 툴킷을 제공한다. 실제 벤치마크에서 어댑터 적용 시 IFEval 정확도가 51%에서 84%로 향상되는 등 성능 개선이 확인됐다. 이러한 모듈화는 기업이 AI 시스템을 더 쉽게 적응시키고 운영 비용을 절감할 수 있도록 지원한다.

배경

LLM 기초 지식, RAG 개념, Python 프로그래밍

대상 독자

LLM을 프로덕션 환경에 배포하려는 엔터프라이즈 개발자

의미 / 영향

이 접근 방식은 AI 모델을 소프트웨어 라이브러리처럼 모듈화하여, 기업이 특정 작업에 최적화된 AI 시스템을 더 저렴하고 효율적으로 구축할 수 있게 한다. 특히 재학습 없이 어댑터만 교체하는 방식은 유지보수와 배포의 유연성을 크게 높인다.

섹션별 상세

기존 LLM은 모든 기능이 파라미터에 분산되어 있어 특정 작업 변경 시 전체 재학습이나 복잡한 프롬프트가 필요했다.

Granite Libraries는 RAG, 안전성, 핵심 기능 등 특정 작업을 수행하는 어댑터 함수를 제공하여 모델을 모듈화한다.

Granite 4.1 3B 모델에 어댑터를 적용하면 IFEval 정확도가 51%에서 84%로 상승하며, 작은 모델로도 대형 모델 수준의 성능을 구현한다.

근거

Granite 4.1 3B 모델에 어댑터를 적용하면 IFEval 정확도가 51%에서 84%로 상승한다. — Granite Libraries 섹션

Project Granite Switch는 추론 시 필요한 어댑터를 동적으로 전환하는 레이어를 추가하여 메모리 재계산 없이 다단계 워크플로를 가속화한다.

Granite 4.1 모델군은 15조 개의 토큰으로 학습되었으며, Apache 2.0 라이선스로 공개되어 기업의 비용 효율적인 배포를 돕는다.

근거

Granite 4.1 모델군은 15조 개의 토큰으로 학습되었다. — Granite 4.1: IBM’s most capable models to date 섹션

용어 해설

Adapter: — 모델의 특정 기능을 수행하도록 학습된 소형 모듈. 전체 모델을 재학습하지 않고도 특정 작업(RAG, 안전성 검사 등)에 맞게 모델의 동작을 변경할 수 있게 하여 효율성을 높인다.
Generative Computing: — AI 모델을 소프트웨어 라이브러리처럼 모듈화하여 재사용 가능한 빌딩 블록으로 구성하는 접근 방식. 복잡한 AI 시스템을 독립적인 기능 단위로 분리하여 개발 및 유지보수 효율을 극대화한다.
RAG: — 외부 데이터베이스에서 관련 정보를 검색하여 모델의 답변에 포함하는 기술. Granite Libraries는 이 과정에서 쿼리 재작성, 답변 가능성 평가 등을 수행하는 어댑터를 제공한다.

언급된 리소스

GitHubGranite Switch

GitHubGranite Libraries

GitHubMellea

문서Granite 4.1 models