healthbench
OpenAI가 60개국 260명 이상의 의사와 협력하여 구축한 의료 AI 평가 벤치마크이다. AI 모델이 실제 임상 시나리오에서 얼마나 정확하고 안전하게 의학적 판단을 내리는지 측정하여 의료 분야의 신뢰성을 검증한다.
OpenAI가 60개국 260명 이상의 의사와 협력하여 구축한 의료 AI 평가 벤치마크이다. AI 모델이 실제 임상 시나리오에서 얼마나 정확하고 안전하게 의학적 판단을 내리는지 측정하여 의료 분야의 신뢰성을 검증한다.