구글과 맞장…네이버, 올 연말 ‘이미지 검색’ 확 바뀐다
[디지털데일리 이대호기자] 최근 네이버 모바일에서 유명인 사진을 검색하면 특정 이벤트별로 사진이 묶이면서 시간 순서대로 나열된다. 이에 따라 스타의 근황을 한눈에 확인할 수 있게 됐다.
이는 네이버 ‘이미지 검색’의 방향성을 엿볼 수 있는 대목이다. 전체적인 이미지 검색 품질을 끌어올리는 것과 동시에 특정 질의군에 대해 확고한 이미지 검색 경쟁력을 갖춘다는 게 네이버의 목표다.
네이버는 올 연말 구글과 경쟁할 수 있는 수준까지 ‘이미지 검색’ 품질을 강화한다는 계획이다. 유명인 이미지 검색(스타 타임라인)처럼 특정 질의군 검색 강화의 경우 구글과 차별화되는 움직임으로 충분히 노려볼 만한 목표다.
그러나 일반적 이미지 검색에선 쉽지 않은 목표다. 이용자는 구글에서 이른바 19금 사진을 쉽게 검색할 수 있다. 방대한 검색 커버리지(영역)를 가졌기 때문이다. 이러한 환경에선 다양한 실험적 시도가 가능하다. 고도의 검색 알고리즘이 아니어도 좋은 품질의 이미지를 확보할 수 있다.
이 부분에서 네이버가 약점을 가진다. 제한적인 커버리지 내에서 이용자 의도를 파악해 최고의 검색 품질을 선보여야 하는데, 이것이 말처럼 쉽지 않다. 네이버는 어떻게 구글과 경쟁할 수 있는 이미지 검색 품질을 구현하겠단 것일까.
◆‘스타 타임라인’ 반응 좋아…특정 질의군 검색 경쟁력↑=지난 3일 네이버 그린팩토리 본사에서 이미지, 동영상 검색을 담당하는 김상범 비전&언어 리더<사진>를 만났다.
김상범 리더는 최근 적용한 스타 타임라인 검색에 대해 “실급검(실시간 급상승 검색어)을 클릭하거나 뉴스 자체를 보려는 목적이 아닌 인물검색 의도를 가진 경우에 노출대비클릭률(CTR) 지표가 이전보다 30~40배 이상 올라갔다”며 긍정적인 이용자 반응을 전했다.
맥락 없이 사진이 나열되던 것에 ‘스토리’를 부여하면 어떨까 고민한 결과물이 바로 스타 타임라인이다.
이와 비슷한 고민이 음식 관련 사진에도 적용된다. 네이버는 이달 말 맛집뷰를 선보인다. 식당 외관부터 내부 인테리어, 메뉴판까지 클러스터링(분류)해서 묶어주는 검색이다. 사진 앞뒤 텍스트를 분석해 맥락을 파악하고 비슷한 사진을 묶는 식이다. ‘조개 파스타’를 검색하면 관련한 다양한 이미지를 볼 수 있다.
‘스타일서치’ 검색도 준비 중이다. 이는 쇼핑과 결합되는 이미지 검색으로 상품 속성까지 파악해 이용자가 원하는 상품을 추려낼 수 있게 돕는다. 이용자가 털이 달린 헤드셋 검색을 원할 때 비슷한 스타일의 헤드셋이 묶인 검색 결과를 볼 수 있다.
이처럼 특정 질의군 검색의 경우 적용할 곳이 많다. 스타일서치처럼 쇼핑과 접목을 시도 중이다. 2층 침대를 검색할 때도 보다 다양한 옵션(설정)을 통해 이용자가 원하는 제품만을 볼 수 있게 돕는다. 김 리더는 “자동차 쪽도 보고 있다”며 “예를 들면 아반떼를 검색했을 때 타임라인으로 만들 수 있지 않을까 생각 중”이라고 전했다.
◆이미지 검색 커버리지 늘린다=네이버는 이처럼 특정 질의어에서 업계 최고 검색 경쟁력을 갖추는 동시에 일반적인 이미지 검색 품질 향상을 목표하고 있다. 이를 위해선 검색 커버리지 확보가 중요하다. 이용자 의도대로 결과가 나오기 위해선 제한적인 검색 커버리지로는 어려움이 크다.
김 리더는 “믿을 수 있는 사이트의 경우 검색에 더 반영할 것”이라며 “위키백과 이미지나 잘 알려진 쇼핑몰, 대학 도메인 내 이미지들이 그런 경우”이라고 말했다.
또 김 리더는 “데이터가 많아질수록 좋은 검색품질을 만들 수 있는 아이디어가 나올 수 있다. 간단한 방법으로도 검색 품질을 높일 수도 있다”면서 “네이버는 더 적은 양에서 좋은 이미지를 찾아야 하기 때문에 알고리즘을 고도화해야 하는 어려움이 있다”고 기술 개선이 녹록지 않음을 전하기도 했다.
◆검색 고도화 위한 ‘LSTM’ 연구=최근 네이버에선 LSTM(Long Short-Term Memory, 장단기기억) 기술을 연구하고 있다. 올해 검색에 적용한다. 이는 검색 알고리즘을 고도화하기 위한 연구로 제한된 검색 커버리지를 극복하기 위한 방법이기도 하다. 딥러닝 분야 중 언어를 분석할 때 좋은 성능을 보여주는 게 바로 LSTM이다.
예를 들어 ‘나는 어제 학교에 XX’라는 불완전한 문장이 있다면 인간은 XX에 들어갈 단어를 ‘갔다’라고 쉽게 유추하지만 기계는 다르다. 이 부분의 예측을 쉽게 하고 좋은 성능을 보여주는 게 LSTM 기술이다. LSTM은 이미지에도 적용할 수 있다. 꽃 옆에 나비가 있으면 이상할 것이 없지만 기계는 나비를 나비 모양의 넥타이로 인식할 수 있다. 여기에서 LSTM이 기계학습을 도와 예측의 정확도를 올려주게 된다. 동영상 역시 이미지의 연속이기 때문에 LSTM를 활용할 수 있다.
김 리더는 “LSTM을 활용해 지금은 발견해내지 못한 수많은 패턴을 발견할 수 있다”며 “올해 목표로 검색에 적용한다”고 말했다. 이어서 그는 “학계에선 정확도를 80%에서 90%로 올리면 많이 올라간 것이라고 하지만 네이버 입장에선 10번 검색 시도 중에 1번을 틀리면 심각한 문제”라며 “연구와 동시에 오류를 제거하는 부가적인 연구를 진행하고 있다”고 말했다.
<이대호 기자>ldhdd@ddaily.co.kr
[양종희 KB금융 회장 1년- 상] 실적 무난했지만 내부통제 문제 심각… 빛바랜 성적표
2024-11-15 15:55:09한싹, 올해 3분기 12억원대 손실…AI 투자·인콤 인수 영향
2024-11-15 15:44:00“금융권 책무구조도, 내부통제 위반 제재수단으로 인식 안돼”
2024-11-15 15:19:319월 국내은행 가계·기업대출 연체율 하락…"분기말 연체채권 정리규모 확대 때문"
2024-11-15 15:11:10