반복적 조향(iterative-steering)이란 무엇인가요?

Question

Accepted Answer

AI와의 대화 과정에서 유해한 흐름이 감지될 경우 단순히 대화를 중단하지 않고 실시간으로 프롬프트를 수정하여 모델이 더 안전하고 긍정적인 방향으로 응답하도록 유도하는 기술이다. 사용자의 의도를 해치지 않으면서도 안전한 대화 경로를 유지하는 데 중요하다.

iterative-steering