스트리밍 응답
서버가 전체 데이터를 한꺼번에 보내지 않고 생성되는 대로 조각(chunk) 단위로 클라이언트에 전송하는 방식이다. LLM 서비스에서 텍스트가 한 글자씩 나타나는 효과를 구현할 때 사용되며 응답 대기 시간을 시각적으로 줄여주는 효과가 있다.