편향 완화
데이터나 알고리즘에서 발생할 수 있는 사회적, 인종적, 성별 편향을 줄이는 기술적 과정이다. 공정한 모델 출력을 보장하고 특정 집단에 대한 차별적 결과를 방지하기 위해 수행된다.
"해로운 결과를 직접 만들어봐야 할까?" AI 레드팀의 윤리적 경계