커먼 크롤
웹상의 방대한 데이터를 수집하여 공개하는 비영리 프로젝트로, 대규모 언어 모델 학습을 위한 기초 데이터셋으로 널리 쓰인다.
트랜스포머 논문 12편의 연결 고리: GPT-2가 모든 기술의 허브였다