솔루션

카카오브레인, 흉부 엑스레이 판독문서 병명 추출하는 프로젝트 깃허브 공개

이종현 기자
ⓒ카카오브레인
ⓒ카카오브레인

[디지털데일리 이종현기자] 카카오브레인이 흉부 엑스레이 판독문에서 특정 병명을 추출하는 의료영상 판독문 전문 레이블러 프로젝트를 ‘깃허브’에 공개했다.

카카오브레인은 글머리 기호 형식 등 정리되지 않은 자연어로 작성된 판독문에서 특정 병명을 추출하는 연구개발 프로젝트를 깃허브에 공개했다고 19일 밝혔다.

사용자는 자연어로 작성된 판독문을 입력하면 판독문 분석 후 13개 병명에 대한 양성‧음성 여부를 알려주게 된다. 흉부 엑스레이 결과를 바탕으로 진단 가능한 병명 중 발병 빈도 또는 중요도가 높은 병명 추출이 가능한 것이 특징이다.

카카오브레인은 의료 진단 업무 개선에 기여하고자 기존에 공개된 타사 모델보다 정확하고 효율적으로 특정 병명을 추출하는 레이블러 프로젝트 연구에 착수했다. 이 프로젝트는 카카오브레인의 흉부 엑스레이 초안 판독문 생성 기술의 내부 성능 검증 연구에도 활용된 바 있다.

레이블러 프로젝트를 깃허브에 공개한 카카오브레인은 지난달 말 레이블러의 학습법과 성능 비교 결과를 담은 논문 ‘대규모 언어 모델을 활용한 향상된 흉부 X선 판독문 라벨링(CheX-GPT)’을 논문 공개 사이트 ‘아카이브’에 게재했다.

카카오브레인 김일두 각자 대표는 “많은 연구자들이 카카오브레인의 레이블러 프로젝트를 테스트 벤치마크로 활용할 수 있도록 직접 제작한 테스트 셋을 공개할 예정”이라며 “자사의 언어 모델을 활용하고, 흉부 엑스레이 데이터를 추가로 학습 시키는 등 레이블러 프로젝트의 성능을 더욱 향상시킬 계획”이라고 말했다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널