국민 포털로 출발한 네이버가 다양한 플랫폼과 서비스들로 영역을 대폭 확장하고 있다. 이용자 경험을 위한 체질 개선뿐만 아니라, 중소상공인(SME) 및 창작자들과 이용자들을 연결해 디지털 비즈니스 시너지를 도모하는 데 골몰하는 모습이다. 이용자가 보는 앞단의 변화가 이 정도라면, 개발 뒷단에선 보다 과감하고 치열한 고민이 필요하다. 이에 디지털데일리는 네이버를 움직이는 기술 리더들을 마블 캐릭터에 빗대 ‘네이버 어벤저스’라는 이름을 붙였다. 이들의 연속 인터뷰를 통해 국내 최대 인터넷 기업의 속 깊은 고민과 핵심 경쟁력의 원천을 짚어보고자 한다. <편집자 주> -네이버 ‘페이스사인’ 개발자 인터뷰①
[디지털데일리 최민지기자] 건물이나 사무실 등을 드나들 때, 보통 게이트 앞에서 몇 초씩 멈춰야 한다. 출입증을 태그하거나, 마스크를 벗고 얼굴을 인식하기 위해서다. 마스크를 벗지 않아도 즉시 본인 인증이 가능해 바로 게이트를 통과할 수 있다면, 1초 차이로 엘리베이터를 놓칠 일도 없지 않을까. 네이버에선 가능하다. 심지어 마스크를 쓴 채로 여러 명이 게이트를 통과할 수 있다.
이와 관련 <디지털데일리>는 네이버 페이스사인(FaceSign) 기술 개발에 참여한 ▲인공지능(AI) 프로덕션팀 김성엽 서버 개발자(백엔드 엔지니어) ▲클로바 서비스 플래닝팀 김형석 기획자 ▲엣지ML팀 감정현 TL ▲이미지비전팀 이명연 모델 개발자(머신러닝 엔지니어)를 만났다.
김형석 기획자는 네이버 페이스사인을 ‘열쇠’를 가지고 다니지 않아도 되는 편리한 경험에 빗대어 설명했다. 도어락을 이용하면, 열쇠가 필요없다. 여기에 더해 번호를 입력해야 할 필요조차 없게 된 것이다.
김 기획자는 “열쇠를 들고 다니다 도어락을 경험했을 때 편리함을 기억하는가. 사원증을 들고 다니다 얼굴인식만으로 편하게 출입하는 경험은 열쇠가 없어진 순간과 같다”며 “게다가 게이트 앞에서 멈출 필요 없이 자연스럽게 걸어가면서 인식 가능하다”고 말했다.
이어 “얼굴인식은 이미 많은 곳에서 사용되는 기술이지만 높은 기술력과 편한 사용성을 동시에 만족시키는 것은 네이버만 가능하다”며 “1장만 촬영‧등록해도 얼굴을 인식할 수 있으며, 0.1초만에 인식해 99.98% 정확도를 올리는 고품질 얼굴인식 엔진”이라고 설명했다.
네이버가 페이스사인 기술을 개발한 이유는 불편함을 해소하는 데 있다. 항상 휴대해야 하는 출입증은 분실과 도용의 위험이 있다. 더군다나, 감염병 시대에서 비접촉식 생체인증 필요성도 커졌다.
이명연 개발자는 “사원증과 같은 실물 인증 수단은 여러 불편함이 있다. 얼굴은 놓고 올 수 없고 잃어버릴 수도 없는 간편한 수단”이라며 “비접촉식 생체 인증이기 때문에 감염병 위험도 방지할 수 있다. 이러한 편의성을 제공하기 위해 페이스사인 기술이 개발됐다”고 전했다.
왼쪽부터 김형석 기획자, 강정현TL, 이명연 개발자, 김성엽 개발자. ⓒ네이버
이러한 페이스사인은 현재 네이버 제2사옥 1784에 적용됐다. 네이버 임직원과 1784에 입주한 사용자들은 한 번에 통과할 수 있는 ‘워크쓰루’로 페이스사인을 매일 경험하고 있다.
사용자가 걸어오고 이를 인식해 통과시키기까지 걸리는 시간은 대략 0.3~0.4초 내외다. 우선, 기기에 설치된 카메라를 통해 걸어오는 사용자의 얼굴을 찾고, 이를 서버로 보내 등록된 사람인지 판단한다. 유사도 관련 기준 점수를 넘겨야 게이트를 지날 수 있다. 출입 기록을 남기고, 문을 열어주라고 신호를 보낸다. 화면에 이름이 나타나는 시간이 모두 포함됐다.
먼 거리에서 빠르게 인식해 걸음을 멈추지 않고 게이트를 통과할 수 있는 이유다. 마스크를 착용해도 같다. 얼굴 인식 상황에서 1000명을 등록했을 때, 마스크를 쓴 얼굴에 대해서도 99% 이상 정확도를 보인다는 설명이다. 출입 사용자가 많아져도 인식속도는 느려지지 않는다.
김성엽 개발자는 “사용자 입장에서는 얼굴을 보여주면 게이트가 열리고 결제가 이뤄지는 것이 단순해 보일지 몰라도, 그 뒤에는 이 사용자가 출입‧결제 권한이 있는 사람인지 확인하고 해당 내역을 기록하며 실제로 게이트를 열어주거나 결제를 완료시켜야 하는 복잡한 과정들이 있다”며 “사용자에게 보이지 않는 연동 작업이 복잡하고 어려울수록 사용자는 더 편리하게 서비스를 사용할 수 있다는 마음 가짐으로 개발했다”고 강조했다.
디바이스에서 딥러닝 모델 처리시간을 한계까지 최대한 줄이기 위한 노력도 병행됐다. 페이스사인 디바이스에서는 얼굴인식 준비단계에 해당하는 얼굴 분석 과정이 매 프레임 수행되고 있다. 네이버는 모바일 CPU향으로 고도로 최적화된 가볍고 빠른 딥러닝 얼굴 분석 기술을 구현했다.
이와 관련 강정현 TL은 “네이버 얼굴인식 소프트웨어개발키트(SDK)는 갤럭시S7과 같은 오래된 모바일 기기에서도 전체 과정이 10ms 이내로 수행될만큼 굉장히 빠른 처리 시간을 보여준다”며 “모바일 환경에 최적화된 경량 모델과, 이 모델을 제 시간에 수행될 수 있도록 뒷받침해주는 인퍼런스 엔진 덕분”이라고 부연했다.