텍스트 스트리밍
LLM이 생성하는 텍스트를 전체 완성 후 한꺼번에 출력하지 않고, 생성되는 토큰 단위로 실시간 화면에 표시하는 기술이다. 사용자는 모델이 답변을 작성하는 과정을 즉시 확인할 수 있어 대기 시간의 지루함을 줄이는 효과가 있다.