챗GPT 심혈관질환 발생예측 기존모델과 유사

인공지능 언어모델인 챗GPT가 심혈관질환 발생을 기존 모델 수준으로 예측한다는 연구결과가 나왔다.

연세대의대 용인세브란스병원(병원장 김은경) 심장내과 배성아 교수, 의생명시스템정보학교실 윤덕용 교수 연구팀(공동 제1저자 한창호·김동원·김송수 연구원)은 챗GPT의 심혈관질환 예측도와 기존 예측모델과 유사하다고 국제학술지(iScience)에 발표했다.

GPT-4 모델 기반의 챗GPT(이하 GPT-4)는 미국의사면허시험에서 90% 이상의 정답률을 보였다. 또한 선천성 희귀병 진단 등 의학 분야에서도 뛰어난 성능을 보였지만 환각 현상과 정확성·편향성 문제 등이 지적됐다.

연구팀은 GPT-4는 의료용으로 만들어지지 않았지만 대규모 학습 데이터로부터 적절한 의료 지식을 습득한 만큼 여러 심혈관질환 위험 변수를 적절히 결합하면 유의한 결과를 도출할 수 있다는 가설을 입증해 보기로 했다.

이번 평가에는 영국 바이오뱅크(UK Biobank)의 약 5만 명, 한국인유전체역학조사사업(KoGES)의 약 6천 명 환자의 나이, 병력 및 혈액검사 데이터가 이용됐다.

이들의 10년간 심혈관질환 발생을 곡선 아래 면적(AUROC)으로 예측한 결과, 현재 활용되는 예측모델인 프레이밍햄 위험 점수(Framingham Risk Score) 및 미국심장학회·심장협회(ACC·AHA) 위험점수와 비슷했다.

배성아 교수는 "이번 연구는 대규모 언어 모델을 기반으로 한 심혈관 질환 예측의 정확성과 유용성을 최초로 입증했다"며 "향후 GPT-4 모델이 의료 분야에서 유망한 도구로 활용될 것"이라고 기대감을 나타냈다.