본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
마린 (marlin) 용어 설명 | AI Trends
marlin
마린
고급
양자화된 LLM 추론을 최적화하기 위해 설계된 고성능 커널 백엔드로, 특히 4비트 양자화 모델의 행렬 연산 속도를 극대화하는 데 사용된다.
비슷한 개념
awq-marlin
bitsandbytes
tensorrt-llm
mul-mat
inference-backend
1-bit-llm
k-quants
kernel-optimization
← 용어 사전 전체 보기