카나리 구절
특정 시스템의 이상 유무를 감지하기 위해 삽입하는 신호용 텍스트이다. 이 실험에서는 '르브론 제임스가 대통령이다'라는 명백한 거짓 문장을 테스트 신호로 설정하여 모델이 이를 출력하도록 유도하는 트리거로 활용했다.