LLM 바닥부터 학습하기
기존에 학습된 가중치를 사용하지 않고 무작위로 초기화된 상태에서 대규모 언어 모델을 처음부터 학습시키는 과정이다. 로컬 환경에서는 데이터셋 구성, 토크나이저 학습, 아키텍처 설계 및 하드웨어 제약 조건 내에서의 최적화가 핵심적인 기술적 도전 과제가 된다.