인터넷

검색기술 전문가들 한자리에…네이버가 첫 ‘콜로키움’ 연 이유는?

이대호

김광현 네이버 검색연구센터장
김광현 네이버 검색연구센터장
- 김광현 네이버 검색연구센터장 “산학 연구 많이 하고 싶다”

[디지털데일리 이대호기자] 국내 검색기술 전문가들이 한자리에 모였다. 흔치 않은 풍경이다. 네이버가 검색기술 관련 콜로키움(Colloquium)을 개최했기 때문이다. 콜로키움은 일반적인 학술대회가 아닌 전문가들이 모여 토론을 가미한 세미나 등의 연구모임을 뜻한다. 네이버도 처음 여는 검색기술 전문 학회다.

21일 네이버(대표 김상헌)는 코엑스 인터컨티넨탈 호텔에서 ‘네이버 라이브 서치 2016’ 콜로키움을 개최했다. 이날 전국 12개 대학, 21개 연구실의 석·박사 120명이 참석했다. 이에 따라 발표 현장에서도 심도 깊은 얘기가 오갔다.

김광현 네이버 검색연구센터장은 콜로키움 첫 개최와 관련해 “채용 목적은 아니다”면서 “(검색기술 관련해) 기자스터디는 몇 번했는데 아쉬운 부분도 있고 보다 관심 있는 분들에게 공개하면 좋겠다고 생각했다”고 취지를 밝혔다. 또 그는 “첫 시도가 괜찮으면 행사를 정기적으로 해서 산학계가 밀접하게 일하면 좋지 않겠나. 좋은 계기가 됐으면 한다”고 말했다.

이날 강연자 중 김상범 리더가 사용자에게 이미지·동영상 데이터를 효과적으로 전달하는 기술을 발표하면서 “네이버가 많은 연구를 한다”며 학계와 공동연구에 대한 의지를 보였다. 이와 관련, 청중 가운데 “학생 입장에서 궁금하다”면서 산학 연구에 대한 구체적인 계획을 묻는 질문이 나오기도 했다.

이에 김 센터장은 “산학 공동연구는 지금도 많이 하고 있는데 사실 알려지지 않았다”면서 “(행사를 계기로) 그런 계획을 더 많이 만들고 싶다”고 말했다. 이어서 그는 “상호 연구하다보면 (입장 차이로) 연구가 안 되는 경우도 종종 있는데 (양측이) 얘기하면서 많이 진행하고 싶다”고 바람을 나타냈다.

다음은 이날 기술 강연(발표자) 요약이다.

◆라이브 검색(강인호 이사)
- 장소와 시간의 제약 없이 실시간으로 정보를 얻고자 하는 모바일 시대에서 이용자들의 의도를 파악해 그에 맞는 생생한 검색 결과를 제공하기 위한 기술.
- ▲좋아요, 댓글, 쇼핑 정보, 뮤직 플레이 등과 같은 사용자의 활동 정보를 피드백 정보로 활용하는 ‘라이브 피드백’ ▲사용자의 현재 상황을 잘 이해하는 ‘라이브 콘텍스트’ ▲ 관심사가 유사한 사용자 네트워크 정보를 활용하는 ‘라이브 위드니스’ 등을 활용해, 사용자 의도를 이해하고 유형화한 뒤, 사용자의 문맥에 적합한 검색 결과를 제공하는 방식.

◆시멘틱 태깅(정유진 리더)
- 질의와 문서에 사용된 단어들의 의미를 구분해 주는 기술로 사용자 검색 의도에 일치하는 문서들만 선별하여 제공하는 기술.
- 검색 의도가 섞여있는 수많은 질의들을 식별하기 위해서는 ‘의미 구분자’가 필요함.
- 시맨틱 태깅은 문맥 내 의미를 인식 및 분석해(시멘틱), 해당 단어에 정확한 의미 구분자(Entity ID)를 부착하는 기술. 원활한 시멘틱 태깅을 위해서는, ‘문맥(context)’으로 출현할 가능성이 높은 단서 확보가 관건.
- 네이버는 네이버가 구축한 방대한 DB를 바탕으로, 검색뿐만 아니라, 다양한 서비스에 시멘틱 태깅을 적용할 예정.

◆Context 기반의 개인화 추천(최재호 리더)
- 빅데이터 분석을 통해 사용자들의 다양한 context를 파악하여 맞춤형 추천 정보 제공
- 모바일이 PC와 다른 점은 ‘로그인’이 되어 있고, ‘항상’ 곁에 있으며, 이용자가 ‘어디’ 있는지 알 수 있음. 이를 바탕으로 사용자가 입력한 검색어와 보고 듣는 콘텐츠를 분석함으로써, 사용자의 ‘관심사'를 파악 가능
- 네이버는 모바일 검색 이용자들의 context(성별/세대, 관심사, 위치/시간)를 분석해 양질의 정보를 제공할 예정

◆Vision&Language 이미지/동영상과 텍스트의 만남(김상범 리더)
- 딥러닝 기반 비전-언어 통합기술을 바탕으로 사용자에게 이미지/동영상 데이터를 효과적으로 전달
- 네이버는 ▲유명인의 고화질 현장 이미지들을 이벤트별로 구성해, 타임라인 형태로 제공 ▲특정 음식점에 대한 데이터를 분석해, 해당 음식점을 가장 잘 나타내는 최적의 이미지를 추출해 제공 ▲한 상품과 유사한 스타일의 다른 상품을 편리하게 검색할 수 있는 기능 등을 제공할 예정

◆Understanding&Information(이현아 리더)
- 사용자의 마음을 들여다 보는 것처럼 질문의 의도를 잘 이해하고, 사용자의 context에 맞는 정보를 적절히 찾아줌으로써 좀 더 똑똑한 네이버로 진화
-사용자 질의를 구조·의미적으로 분석하여 검색 의도를 잘 파악하기 위한 NLU기술
- 정형화되어 있지 않은 빅데이터로부터 사용자가 궁금해하는 지식을 추출하는 IE 기술

◆네이버 인공지능 대화 시스템: LAON(서희철 리더)
- 사용자와 대화하듯이 검색결과를 제공하는 시스템으로 대화를 분석해, 사용자에게 적합하면서 간결한 검색결과 제공
- 네이버앱 내 음성 검색 시, 상대방과 묻고 답하는 대화방식으로 답변 제공
- 인물, 영화, 방송, 날씨 등의 카테고리에 선 적용할 예정

◆Feature-based Crawl for Mobile Web(원성재 리더)
- 모바일에서 좋은 콘텐츠를 찾기 위한 수집기술의 변화
- 모바일 시대가 되면서 발생한 새로운 문제들을 해결하기 위한 네이버 수집시스템의 정책과 수집방식에 변화
- 개선된 수집기술로 외부 생산자들의 좋은 콘텐츠가 네이버 검색에 더 잘 노출될 수 있도록 할 예정.

◆Context 엔진 CASE(강유훈 리더)
- Context/AI 기반의 신규 검색 서비스를 지원하는 시스템 기술
- 네이버는 대규모 텍스트, 이미지/동영상, 이용자 활동 등 방대한 로우(raw) 데이터 중에서, 콘텍스트를 보다 잘 추출하고 데이터를 보다 잘 이해하기 위해, ‘CASE’라는 대규모 실시간 데이터 처리 및 이해 기술을 개발
- 네이버는 CASE를 기반으로 이용자의 실시간 콘텍스트를 정확히 파악해 검색 결과를 제공할 예정

◆네이버 검색을 떠받치는 검색시스템: BREW(곽용재 이사)
- 하루 15억건의 질의를 받아 0.9초 안에 결과를 응답하는 국내 인터넷 서비스 중 최대의 트래픽을 처리하는 대규모 검색 시스템 기술
- 네이버는 라이브 검색에서 필요한 실시간 갱신을 대규모 데이터 기반의 검색 상에서 구현하기 위해 ‘BREW(Burst, Real-time, Event-Wise Search System)’라는 검색 시스템을 자체 개발함.
- 네이버는 이 기술을 통해서 대용량의 라이브한 피드백, 컨텍스트, 위드니스 등의 정보에 대해 실시간으로 ‘수신 저장 - 빅데이터 처리 - 검색 반영’ 절차를 수행하여 사용자들에게 생생한 품질의 검색서비스를 제공할 예정

<이대호 기자>ldhdd@ddaily.co.kr

이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널