인터넷

네이버, 유사문서 노출 줄인다…검색 결과서 뉴스 등 노출 강화

이대호 기자

- 창작문서 노출 강화…기사 검색 의도 파악해 뉴스 영역 상단 노출

[디지털데일리 이대호기자] 포털사이트 네이버에서 뉴스 검색 시 이른 바 퍼온 글(펌글)이 포함된 블로그 등의 콘텐츠가 원본문서인 뉴스 콘텐츠보다 화면 상단에 노출되는 일이 줄어든다.
 
30일 NHN(www.nhncorp.com 대표 김상헌)은 서울 소공동 웨스틴조선호텔에서 기자간담회를 갖고 네이버의 유사문서 판독 프로젝트의 현황 및 개선 방안에 대해 발표했다. 이와 함께 검색 통계 서비스인 ‘네이버 트렌드’도 공개했다.

이에 따라 이용자들이 기사를 찾고자 하는 검색 의도가 명확한 경우에 뉴스 영역이 통합검색 결과 상단에 노출된다. 네이버는 ‘사용자 질의와 기사의 적합도+질의의도 분석+사용자 선호도’를 종합해 이용자의 검색 의도를 파악한다. 쉽게 말해 뉴스 주제어 등이 검색어에 포함된다면 뉴스가 우선 노출되는 식이다.

네이버가 사례로 제시한 검색어는 ‘서울 전세값 소폭 올라’로 기존 검색 시스템에서는 블로그가 상단에 노출되고 뉴스 영역이 위에서 3번째 영역에 위치하게 된다. 네이버는 이번 유사문서 판독 프로젝트의 개선에 따라 같은 검색어를 넣을 시 뉴스가 상단에 노출되는 결과를 보여주는 영상을 공개했다.

또 다른 검색어인 ‘구미 불산 누출 피해 보상’도 유사문서 판독 프로젝트의 개선에 따라 뉴스가 최상단에 노출된다. 기존 검색 시스템에서는 위에서 5번째 영역에 뉴스가 노출됐다. 이번에 개선된 시스템은 오후 2시부터 포털 네이버에 적용된다.

김광현 NHN 검색연구실장<사진>은 “블로그 검색의 트래픽 감소가 예상된다”면서도 “원본으로 트래픽이 더 많이 가야 옳지 않겠나”라며 입장을 밝혔다.

이어서 김 실장은 “누가 봐도 복사 문서라고 판단이 되면 검색에서 제외된다”며 “(퍼온 글에서) 약간의 개량이 되면 랭킹으로 조정돼 창작문서의 하단에 노출이 되도록 목표를 가지고 개발 중”이라고 덧붙였다.

이와 함께 NHN은 차후 ‘블로그 검색 반영 안내센터’를 운영할 계획이라고 발표했다. 이용자들은 안내센터를 통해 자신이 작성한 글이 ▲네이버에서 검색되는지를 확인해 검색반영을 요청하거나 ▲유사문서로 분류된 경우 원본반영을 요구할 수 있고 ▲무단 복사된 글에 대해서는 검색 제외 신고도 가능하다.

이윤식 NHN 검색본부장은 “네이버는 ‘프로젝트 BiO’를 통한 펌글 제어 노력과 이를 위한 연구개발을 지속적으로 진행해 나갈 계획”이라며, “이와 함께 이용자들과의 활발한 소통을 더해 창작자들의 콘텐츠 창작 의지를 더욱 북돋우고 이용자들이 풍성한 콘텐츠를 두루 만날 수 있는 선순환의 인터넷 환경이 조성될 수 있도록 노력을 다하겠다”고 밝혔다.

또한 NHN은 네이버 검색어의 기간별 검색추이를 확인할 수 있는 ‘네이버 트렌드’ 서비스를 공개하고 이날 곧바로 적용될 예정이라고 밝혔다. 네이버 트렌드는 하루 1800만명이 방문해 이용하는 네이버 통합검색에서의  ‘검색어 통계’를 보여주는 서비스다.

네이버 트렌드는 최고 검색횟수를 기록한 키워드를 100으로 환산해 표시하고 나머지 키워트를 상대값으로 화면에 표시해준다. 최대 5개의 키워드간 상대적 검색 추이를 비교할 수 있다. 검색 통계 결과 그래프에서 상위 7개의 검색 최고점(Peak)에는 관련 뉴스도 함께 보여준다.

가령 대표적인 여가 활동인 ‘등산’과 ‘캠핑’을 네이버 트렌드에 입력해 보면, ‘등산’이 낮은 기울기로 감소하는 반면 ‘캠핑’은 2009년 이후로 급증하는 것을 확인할 수 있다. ‘설악산 단풍’과 ‘내장산 단풍’의 경우 해마다 ‘설악산 단풍’의 최고점(Peak) 위치가 내장산보다 조금씩 빠르게 나타난다.

네이버 트렌드 서비스는 포털 검색과 달리 청소년 유해어 여부에 따른 이용 제한이 없다. 검색 결과가 아닌 검색횟수의 추이를 보여주는 서비스이기 때문에 별다른 조치가 없었다는 게 회사 측 설명이다.

이에 대해 김유원 NHN 데이터정보센터 박사는 “청소년 유해어라고 하더라도 검색량을 보여주는 것이기 때문에 특별한 문제는 없다고 본다”며 “문제 소지가 있다면 조치하겠다. 그 외 제외되는 검색어는 검색량이 매우 적은 이야기 등으로 프라이버시 이슈가 있어 제외한다. 일정 수준의 검색량이 넘으면 모두 네이버 트렌드에 노출된다”고 말했다.

<이대호 기자>ldhdd@ddaliy.co.kr

이대호 기자
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널