우주로 뻗는 머신러닝… 구글, ‘새로운 외계 행성 발견했다’
[디지털데일리 이형두기자] 구글이 머신러닝(기계학습) 기술을 활용해 우주의 새로운 행성을 발견한 사례를 소개했다.
‘구글 포토’에서 이미지를 분류할 때 쓰는 신경망 기술을 천체 관측에 활용했다. 이 모델을 통해 구글은 천문학자들이 미처 발견하지 못했던 2개의 행성을 찾아내는데 성공했다.
31일 구글코리아는 서울 강남구 본사에서 ‘구글AI 포럼 - AI 혁신과 천체의 발견’ 행사를 열고 인공지능과 머신러닝 기술을 우주 연구, 의료 등 인류 난제에 다양하게 적용한 사례를 공개했다.
구글에는 근무 시간 20%를 본인의 관심분야 연구에 투자할 수 있는 ‘20% 프로젝트’ 제도가 있다. 구글 브레인팀 시니어 리서치 소프트웨어 엔지니어 크리스 샬루는 이 제도를 활용해 천체 관측 분야 연구를 진행했다.
미항공우주국(NASA)은 지난 2009년부터 물과 생명체 존재 가능성이 높은 ‘제2의 지구’를 찾는 케플러 미션을 진행해왔다. 행성을 찾아내는 방법 중 하나는 오랜 기간 동안 별의 밝기를 관찰하는 것이다. 행성이 별 주위를 공전하면 망원경이 관측하는 별의 밝기에 영향을 미치기 때문이다. 특히 행성이 별과 망원경 사이를 지날 때 ‘빛의 곡선’이라고 불리는 뚜렷한 밝기 저하가 나타난다.
NASA는 케플러 우주망원경을 통해 4년 동안 기록한 20만개 항성의 밝기 데이터를 확보했다. 천문학자들은 수동으로 이를 판별해왔다. 약 3만개의 시그널을 분석해 약 2500개의 행성이 확인됐다. 그러나 확보한 데이터 포인트는 총 140억개에 달했다. 판별에 시간이 오래 걸리고, 신호가 약한 시그널은 검토할 수 없었다.
크리스 샬루는 이 과정을 빠르고 효과적으로 진행하기 위해 머신러닝 기술을 ‘빛의 곡선’ 판별에 도입해보기로 했다. 그는 “천체 관측 데이터는 인간이 식별하기 어려울 정도로 너무 방대한 데이터”라며 “기계 학습 적용이 가장 적합하리라 생각한다”고 설명했다.
그는 천문학자들이 분류해놓은 1만5000개의 시그널로 신경망을 학습시켰다. 그리고 과거에 이미 분석이 진행됐던 670개의 항성에 대한 데이터를 다시 분석했다. 테스트 결과, 행성과 행성이 아닌 신호를 96% 확률로 구분해냈다. 아울러 이 과정에서 '케플러90i', 케플러80g‘라는 새로운 행성이 발견됐다. 이 발견 덕분에 태양계처럼 8개의 행성을 보유한 항성계의 존재가 최초로 밝혀졌다.
그는 “항성의 위치정보 데이터를 이 모델에 추가해 정확도를 더 개선할 예정”이라며 “검색 대상을 종전 670개에서 20만개로 분모값을 확대해, 더 많은 행성을 찾아내려고 한다”고 말했다.
구글은 이밖에 의료사진 분석, 에너지관리, 그리고 머신러닝을 설계하는 머신러닝 등 다양한 분야에 머신러닝 기술을 접목하는 연구를 진행 중이다. 유방암 진단 케이스가 대표적이다.
홍준성 구글코리아 엔지니어링 총괄 디렉터는 “유방암 진단은 10기가 픽셀에 달하는 메디컬 이미지 수십장을 전문가들이 분석하면서 진단한다”며 “아무리 트레이닝을 잘 받아도 12케이스 중 1케이스 정도는 오진을 할 수 밖에 없을 정도로 어려운 작업”이라고 설명했다.
구글은 성과 측정 결과 병리학자가 0.73, 러신러닝 기술이 0.89 정도의 정확도를 보였다고 밝혔다. 그는 “이는 전문의 판단척도와 거의 유사한 성과, 아직 완전한 적용이나 대체는 어렵지만 가능성을 보고 있다고 이해해달라”고 말했다.
이어 “구글은 머신러닝이라는 기술이 특정 소수집단의 기술이 아니라, 전산학의 프로그래밍처럼 보편타당한 기술이 되어야 한다고 생각한다”며 “머신러닝 트레이닝 코스를 외부에 공개하기 위한 마무리 작업이 진행 중, 향후 한국 사람들도 쉽게 사용할 수 있도록 개방을 준비하고 있다”고 전했다.
<이형두 기자>dudu@ddaily.co.kr
주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52네이버페이, 한국재무관리학회 ‘상생금융 우수기업상’ 수상
2024-11-22 16:44:59케이‧토스‧카카오뱅크, 3분기 중저신용대출 비중 30% 상회
2024-11-22 16:41:56