AI 전문가들, “한국에서 AI 개발… ‘한국어’가 난제”
[디지털데일리 이형두기자] 인공지능(AI) 전문가들이 한국에서 AI 개발이 어려운 이유 중 하나로 ‘한국어’를 꼽았다.
26일 구글코리아는 서울 삼성동 구글캠퍼스에서 산‧학‧연 주요 인사들이 AI를 논하는 ‘AI위드구글2018’ 컨퍼런스를 열었다. 구글 본사에서 AI 프로젝트를 총괄하는 제프 딘 시니어 펠로우가 방한해 기조연설을 맡았으며, 국내 학계에서는 카이스트 황의종 교수, 산업계에서는 SK텔레콤 AI리서치센터 김윤 센터장 및 다양한 AI 전문가들이 참석해 최근 이슈와 현안을 토론했다.
지인 기반 추천 채용 서비스를 제공하는 스타트업 원티드랩은 이날 AI를 통한 구직자-일자리 매칭 솔루션 사례를 발표했다. 이력서를 머신러닝(기계학습)으로 분석해 구직자가 지원 기업에 합격할지 여부를 미리 예측하는 기술이다.
원티드랩에서는 월간 1만5000건의 구직자 지원이 발생한다. 이 중 서류가 통과되는 비율은 약 8%에 불과하다. 포지션에 적합하지 않거나 그냥 찔러보는 스팸성 지원도 있다. 이를 머신러닝 모델로 걸러내자 2배수까지 합격 가능성 예측이 가능해졌다. 1/2 확률로 서류 통과가 가능해졌다는 얘기다.
황리건 원티드랩 제품 총괄은 AI 모델 개발 과정에서 ‘한국어’가 가장 난제였다고 했다. 그는 “이력서를 분석하려면 한글 데이터를 읽어내는 기술이 중요한데, 이와 관련된 데이터도 잘 갖춰져 있지 않고 연구 인력도 부족했다”며 “특히 스타트업은 처음부터 끝까지 다 스스로 개발해야 하므로 어려움이 더 큰 편, SK텔레콤이나 카카오같은 대기업이 이런 부분을 공유하고 정부에서도 데이터 셋을 만들었으면 좋겠다”고 말했다.
김윤 SK텔레콤 AI리서치센터 센터장도 같은 고민이 있었다며 동의했다. 김 센터장은 SK텔레콤 합류 이전 AI 기술 스타트업 대표를 역임하기도 했다.
그는 “우리가 훈민정음이라는 거대한 문화유산을 물려받았는데, 디지털 세계에 맞게 연구 개발하고 있는지 근본적인 질문이 필요하다”며 “미국에서는 방탄소년단이 차트 1위를 차지하고 현지인들이 한국말로 가사를 배우려는 시도가 이어지는 상황, 우리가 한국어 지키고 연구해서 장기적인 계획을 마련하고 널리 쓰일 수 잇는 데이터베이스, 데이터 셋의 공유를 도모하려는 노력이 필요하다”고 전했다.
제프 딘 구글 AI 총괄은 “머신러닝이나 AI가 기여할 수 있는 부분 중 하나는 한 언어에서 관찰된 원리를 다른 언어에도 적용할 수 있는 것”이라며 “구글은 이미 100여개 언어를 서포트하고 있으며, 기본적인 자연어 처리 기술이 발전되면 한국어 처리에 대한 부분도 개선이 되리라고 생각한다”고 답했다.
한국 환경이 예기치 않게 AI 기술 개발에 도움이 된 사례도 언급됐다. 유승일 카카오모빌리티 랩장은 “한국의 경우 산, 터널, 빌딩이 많아 지도 측위가 어려운 편, 모빌리티 서비스 도착지 분포도 복잡해 6차원 인덱스를 잡아서 머신러닝 모델을 짜야한다”며 “덕분에 업계 선두주자들인 우버, 디디추싱보다 이런 문제를 AI로 더 잘 풀어내고 있다”며 자신감을 보이기도 했다.
정규환 뷰노 최고기술책임자(CTO)도 한국은 대형 병원들이 많아 의료 데이터 확보에 강점이 있다고 설명했다. 뷰노는 AI로 의료영상을 분석해 진단을 보조하는 솔루션을 선보인 스타트업이다. 이 솔루션은 소아 골연령 측정에 활용되기도 한다. 손 엑스레이 사진을 AI가 판독해 나이에 맞는 뼈 상태인지 3초 안에 분석한다.
정 CTO는 “서울아산병원은 약 2700병상을 보유하고 있는데, 이는 세계적인 규모”라며 “서울에만 이 정도 규모 병원이 5개 이상 있으며, 또 전 국민이 매년 건강검진을 통해 고품질 의료 영상을 찍고 수준 높은 의사들이 판독해주는 나라는 전 세계적으로 흔하지 않다”고 말했다.
다만 정 CTO는 의료 데이터 활용에 제약이 많아 어려운 점이 있다고도 했다. 그는 “의료 데이터는 비식별화 과정을 거쳐야 활용할 수 있지만 이 기준이 명확하지 않다”며 “누군지 못 알아보면 괜찮다지만, 키와 몸무게도 누군가에겐 프라이버시 침해일 수 있어 정확한 기준 마련이 시급하다”고 말했다.
<이형두 기자>dudu@ddaily.co.kr
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18