연쇄적 권위적 오류
하나의 잘못된 정보가 권위 있는 출처나 시스템에 의해 정당화되면서 연쇄적으로 허위 사실이 확산되고 고착화되는 현상이다. AI가 가짜 인용문을 만들어 자신의 오류를 방어하는 행위가 대표적인 사례이다.
AI 안전은 진실로부터 AI를 보호하는 수단인가? 펜타곤과 손잡은 OpenAI의 위험한 변화