인터넷

구글, 얄밉다가 이젠 무섭기까지…인공지능 기술력 과시

이대호

[디지털데일리 이대호기자] ‘얄밉다가 이젠 무섭기까지’ 최근 구글의 움직임에 가장 적당한 말일 듯하다.

올해 구글은 정밀지도 국외 반출 시도로 여론의 뭇매를 맞았다. 그러나 지도 반출만을 고집했을 뿐 정부와 협의하려는 움직임도 의지도 보이지 않았다. 그 와중에 구글의 조세회피 의혹이 제기됐고 국정감사에선 민감한 질문에 모르쇠로 일관하는 등의 태도 논란까지 불거졌다. 업계는 물론 이용자들 사이에서도 구글에 대한 부정적 여론이 확산됐고 결국 지도 반출 시도는 좌절되고 만다.

지도 반출 불허 결정이 난지 얼마 되지 않아 구글이 인공지능(AI) 기술력 과시에 나섰다. 29일 구글코리아가 역삼동 사무실에서 ‘AI(인공지능) 혁신의 시대: 구글 포토와 구글 번역’ 기자간담회를 개최하고 새 기능을 소개했다.

구글은 AI 기반의 자동화된 사진 분류와 손쉬운 검색 그리고 단어가 아닌 문장 단위 번역을 통한 자연스러운 번역 결과물 등을 주요 변화로 내세웠다. 이날 선보인 구글 서비스를 보면 기술력만큼은 세계 최고라고 해도 좋을 수준이다.

무서운 점은 이들 서비스가 전 세계를 대상으로 이뤄진다는 것이다. 구글은 아날로그 사진을 스마트폰으로 촬영해 고품질의 디지털 파일로 변환할 수 있는 앱도 선보였다. 사진만 찍으면 구글 클라우드에 자동으로 전송, 무제한 저장된다. 과거부터 현재 그리고 미래까지 삶의 모든 순간이 구글 클라우드와 연결되는 시대가 온 것이다.

구글 번역은 103개 언어를 지원한다. 구글이 선보인 신경망 기계번역은 한국어를 포함해 8개 언어를 지원하지만 결국은 103개 언어에 모두 적용할 계획이다. 구글 서비스를 통하지 않으면 우리 생활이 점차 불편해지는 시대가 오고 있는 셈이다.

◆‘구글 포토’ 더 똑똑해졌다=구글 포토는 지난 2015년 5월 출시돼 1년 만에 2억명의 월사용자를 기록한 구글의 주력 서비스다. 고품질(1600만 화소 이하) 사진을 무제한 무료로 저장할 수 있다.

구글 포토는 AI를 활용해 사진 속 피사체, 장소, 인물, 환경 등을 모두 인식해 관련 사진을 자동 분류해주는 것이 특징이다. 전 세계에서 수집된 방대한 데이터를 통해 기계학습(머신러닝)을 거친 결과다. 이용자가 결혼이라고 캡션이나 태그를 추가하지 않아도 결혼식 사진을 자동으로 분류해주고 강아지만 나온 사진을 따로 검색결과로 모아서 보여준다. 어떤 사진이 결혼식과 관련돼 있는지 강아지가 어떻게 생겼는지 구글 포토가 이미 인지하고 있는 것이다.

동영상 관리도 편하게 할 수 있다. 아기가 잠자는 모습을 찍은 영상이 있다면 구글 포토가 자동으로 관련 동영상을 묶어 앨범으로 만들고 자장가까지 배경음악으로 자동 적용해준다.

◆옛 추억까지 구글 서비스로 연결=최근 구글은 포토스캐너 앱을 출시했다. 사진을 스캔한 것과 같은 효과를 얻을 수 있는 앱이다. 오래된 필름 사진도 이제 구글 클라우드에 손쉽게 올릴 수 있게 됐다.

이용자는 스마트폰으로 사진을 촬영할 때 네 개의 가장자리 초점을 맞추는 과정을 거치게 된다. 이를 통해 반사광 부분을 제거하고 잘 나온 부분만을 병합해서 고품질의 디지털 사진파일을 만들어준다. 사진 회전도 따로 할 필요 없다. 구글 포토가 자동으로 인식해 바로 잡아준다. 탭 한번으로 구글 포토와 연동되는 것은 물론이다.

한국어 등 8개 언어에 신경망 기계번역 첫 적용=구글 번역은 구글의 대표적인 글로벌 프로젝트다. 103개 언어를 번역 지원한다. 전 세계 인구 99%가 쓰는 언어를 번역할 수 있다. 하루 1400억개 이상의 단어가 번역된다.

이 가운데 문장을 통째로 인식해 자연스러운 번역이 가능한 ‘신경망 기계번역’ 기술은 한국어 등 8개 언어에 먼저 적용됐다. 영어, 포르투갈어, 프랑스어, 독일어, 터키어, 중국어, 일본어 등이다.

버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 “신경망 기계번역 기술 덕분에 구글 번역은 위키피디아 및 뉴스매체의 샘플문장을 기준으로 주요 언어 조합을 평가대상으로 했을때 번역 오류가 55%에서 85%가량 현저히 감소하는 등 지난 10년간 쌓아온 발전 그 이상의 결과를 단번에 이룰 수 있었다”고 강조했다. 그는 또 “신경망 기계번역은 103개 언어에 모두 제공하게 될 것”이라고 덧붙였다.

◆다중언어 번역 기계학습 중…모든 언어 대상 번역 고도화=구글은 다중언어를 동시에 번역하는 기계학습을 거치고 있다. 이를 통해 한 언어의 번역 결과물을 다른 언어에도 적용할 수 있다. 번역 데이터를 공유, 이전시키는 것이다.

예를 들어 한국어와 일본어 간 번역 데이터가 없다고 가정해도 한국어, 일본어와 모두 연결되는 영어의 번역 결과물로 한국어와 일본어 간 번역도 지원할 수 있게 된 것이다. 이렇게 되면 이론적으로 모든 언어의 번역 데이터를 연결시키고 활용할 수 있다.

이를 통해 구글 번역 프로덕트도 보다 간소화된 구조를 가질 수 있었다. 103개 언어는 번역 조합으로 약 1만개 가량이 나오게 되는데 다중언어 번역을 통해 한꺼번에 학습을 거치게 되고 또 학습 데이터가 서로 공유되면서 번역 고도화 속도까지 빨라지게 됐다.

버락 투로프스키 총괄은 “언어장벽이 더 이상 장애물이 되지 않는 세계가 될 것”이라고 자신감을 보였다.

<이대호 기자>ldhdd@ddaily.co.kr

이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널