인터넷

‘뉴스 알고리즘 조작?’ 정치권·방통위 압박에 네이버가 대응하는 방법

이나연 기자
네이버 뉴스 AI 알고리즘 안내 페이지 갈무리 [ⓒ 네이버]
네이버 뉴스 AI 알고리즘 안내 페이지 갈무리 [ⓒ 네이버]

[디지털데일리 이나연 기자] 정치권이 네이버 뉴스 알고리즘에 인위적 조작이 있었다는 의혹을 제기한 데 이어 방송통신위원회도 실태점검에 나서자, 네이버가 적극적인 해명에 나섰다. 이용자가 알기 쉽게 뉴스 인공지능(AI) 알고리즘 안내 페이지를 개편하고, 외부 전문가로 꾸려진 뉴스 알고리즘 검토위원회 활동을 지속하는 등 포털 뉴스 서비스 운영에 대한 투명성을 높이겠다는 의지다.

네이버는 지난 7일 뉴스 AI 알고리즘 안내 페이지를 공개했다. 이는 지난해 진행한 네이버 ‘2차 뉴스 알고리즘 검토위원회’ 권고 사항에 따른 것이다. 당시 2차 검토위는 ‘뉴스 서비스 원칙과 지향을 구체적으로 서술하고 사회적 소통을 더 강화할 것’이라는 의견을 전한 바 있다. 기존에도 네이버는 공식 블로그 등을 통해 관련 설명을 진행했으나, 산발적으로 흩어져 있다는 한계와 더 자세한 설명에 대한 요구가 존재했다.

안내 페이지는 ▲도입 배경 ▲에어스(AiRS) 추천 ▲알고리즘 팩터 ▲클러스터링 ▲기술 고도화 ▲검토위 진행 ▲질의응답(FAQ)으로 구성됐다. 다만, 최근 여당이 집중 공세를 벌이는 언론사 인기도 지수에 대한 논란은 지난달 출범한 3차 알고리즘 검토위원회를 통해 철저한 분석 후 결과를 공개할 예정이다.

◆“이 기사 나한테 왜 떴지?” 네이버가 밝힌 뉴스 AI 알고리즘 시스템

먼저 네이버 뉴스 알고리즘은 다음 세 가지 요소를 고려한다. 첫째, 매일 생산되는 수만건 기사 중 실시간으로 사용자 선호도를 예측할 것. 둘째, 자동화한 방식으로 뉴스 품질을 측정해 품질 높은 기사를 추천할 것. 셋째, 대다수 사용자에게 추천 가능한 주요 이슈를 감지할 것.

네이버가 뉴스 추천을 목적으로 자체 개발한 AI 알고리즘인 AiRS로 뉴스를 추천하는 과정은 ▲로그인 사용자 기사 소비 ▲4개 추천 모델로부터 추천 후보군 생성 ▲생성된 후보군 중 다양한 피처(팩터) 반영해 기사 간 랭킹 매기기 ▲서비스 화면에 사용자별 뉴스 노출 단계로 이뤄진다.

네이버 뉴스에 접속한 사용자가 특정 기사를 읽으면 해당 기사에 대한 소비 이력이 생성되는데, 이에 기반해 ‘협업 필터(CF)’와 ‘품질 측정(QE)’, ‘사회적 영향도(SI)’ 모델이 사용자에게 추천할 기사 후보군을 만든다. 가령 사용자가 선호할 것으로 보이는 기사와 사용자 만족도가 높은 기사, 단기간에 급부상한 사회적 이슈 등을 선별하는 것이다.

해당 기사 후보군은 개인화 피처(NPMI, 언론사, 키워드, 섹션, 기자구독 여부)와 비개인화 피처(최신성, 품질, 인기, 클러스터, 소셜임팩트)로 추천 점수와 랭킹이 매겨진다. 최종적으로 AiRS 추천뉴스라는 이름으로 서비스 영역(모바일 MY뉴스·PC/모바일 섹션홈 뉴스·PC우측 분야별 주요뉴스·모바일 기사본문 ‘함께 볼만한 뉴스’ 등)에서 관련 뉴스가 제공된다.

네이버는 이 과정들에 정치적 편향성은 배제됐다고 강조한다. 네이버는 “알고리즘 자체에는 기사 및 사용자 정치 성향을 특정 짓거나 구분하는 부분이 전혀 없기에, 특정 성향에 유리하게 추천하는 것은 기술적으로 불가능하다”고 밝혔다. 뉴스 추천은 개인 뉴스 이용 행태, 전체 이용자들 클릭 수, 언론사가 송고한 기사 내용 등에 따르므로 네이버가 인위적으로 개입할 수가 없다는 의미다.

◆알고리즘이 고른 기사 후보군에서 최종 선정되는 뉴스, 어떤 판단 기준 따를까?

실제 네이버가 이번 안내 페이지 알고리즘 팩터 부문에서 정리한 내용에 따르면, 뉴스 알고리즘 추천에 영향을 미치는 주요 팩터는 총 16개다. 팩터는 이용자마다 다르게 적용하는 ‘개인화’와 그렇지 않은 ‘비개인화’로 나뉜다.

개인화 팩터는 ▲‘최근 클릭한 기사’들과 ‘함께 많이 클릭되는 기사’ ▲최근 클릭한 섹션(분야) 선호도 ▲특정 언론사 기사에 대한 선호도 ▲클릭한 기사 제목에 존재하는 키워드 선호도 ▲클릭한 기사 제목과 본문에서 추출한 엔터티(사물이나 객체) 키워드 선호도 ▲기자 구독 여부 ▲언론사 구독 여부 등이다.

비개인화 팩터는 ▲기사 내용과 이미지 등 품질 점수 ▲기사 클릭수로 측정한 인기도 점수 ▲제목과 본문이 유사한 기사들을 묶은 기사 클러스터 점수 ▲기사 클러스터 최신성 ▲언론사와 사용자가 동시에 주목하는 소셜임팩트(SI) 점수 ▲기사 최신성 ▲심층기사 여부 ▲신문 지면 위치 점수 ▲시간당 기사 생산량 등이다.

한편, 네이버는 지난달 29일 제3차 알고리즘 검토위원회를 발족했다. 네이버는 뉴스 알고리즘에 대한 사회적 기대와 책임에 부응하기 위해 지난 2018년 국내외 포털사업자 중 최초로 외부 전문가 그룹으로 이뤄진 ‘뉴스 알고리즘 검토위원회’에 알고리즘을 검토 받고, 의견을 수렴해 서비스에 반영하는 노력을 이어오고 있다.

3차 알고리즘 검토위는 한국인공지능학회·한국정보과학회 언어공학연구회·한국정보과학회 인공지능소사이어티·카이스트 인공지능 공정성 연구센터 등 학회 및 기관에서 추천한 전문가 중 총 6인 위원들로 구성됐으며, 위원장으로는 유창동 위원(카이스트 전기 및 전자공학부 교수)이 선출됐다.

3차 알고리즘 검토위는 추천 심층성 강화와 추천 다양성 개발, 신규 추천 모델 개발 등을 주제로 에어스(AiRS) 뉴스 추천, 뉴스 검색 알고리즘 전반에 대한 검토를 진행할 예정이다. 해당 검토 결과는 연내 발표된다.

이나연 기자
lny@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널