인터넷

네이버 문자인식기술, 국제 대회서 1위 평가

이대호
- 문자인식기술(OCR) 분야 국제 경진대회서 알리바바·텐센트 등 제쳐
- ‘파파고’ 등 실제 서비스에 적용 예정

[디지털데일리 이대호기자] 네이버(대표 한성숙)는 인공지능 플랫폼 클로바(Clova)와 인공지능 통번역 서비스 파파고(Papago)의 공동 문자인식기술(​​OCR) 연구 팀이 글로벌 업체들과 경쟁에서 기술력을 입증했다고 10일 밝혔다.

OCR(Optical Character Recognition)은 크게 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’과 ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다. 이 가운데 네이버의 문자 검출 기술이 알리바바, 텐센트, 센스타임 등과의 경쟁에서 가장 높은 점수를 기록했다.

이 같은 성과는 국제패턴인식협회(IAPR)가 시작한 국제 경진대회(ICDAR Robust Reading Competition)에서 일궜다. 디지털 이미지와 비디오 상에서 문자를 감지·인식하는 기술(Robust Reading) 분야에서 가장 권위있는 국제경진 대회로 네이버는 올해만 세 가지 과제에서 1위를 기록했다.

네이버는 지난 2017년에 공개된 다국어 데이터를 기반으로 한 문자 영역 검출에 대한 과제 ‘Multi-Lingual scene Text(MLT) – Localization’에서 73.68%를 기록하며 1위를 차지했다. 해당 기술은 영어를 포함한 라틴 계열의 문자뿐만 아니라, 한국어, 일본어, 중국어, 아랍어, 뱅골어 , 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로, 단일 언어를 검출하는 것 보다 훨씬 고도화된 기술력이 요구된다는 게 회사 설명이다.

2017년 다국어 데이터 기반의 문자 종류 구분에 대한 과제​ ‘Multi-Lingual scene Text (MLT) - Script Identification‘에서도 1위를 차지했다. 네이버 클로바 팀에서 인턴으로 재직하고 있는 정성효 학생(고려대 주재걸 교수 연구실 소속) 주도로 연구한 방식이 89.01%를 기록했다. ​문자 종류 구분은 다국어 문자 검출 기술과 연관된 기술로 검출된 영역에 해당하는 총 7개의 문자 종류 중 하나의 문자 종류로 분류하는 기술이다.

지난 6월엔 2013년에 공개된 근접 촬영 데이터에 대한 문자 영역 검출 과제​ ‘Focused Scene Text – Localization’에서 네이버의 문자 검출 기술이 타 글로벌 AI 기업 대비 가장 높은 점수인 94.02%를 기록한 바 있다.

해당 연구를 진행한 네이버 클로바 비전(VISION)팀의 이활석 연구자는 “OCR 분야의 공신력 있는 세계 경진 대회에서 네이버가 좋은 성과를 기록하며 글로벌 업체들 사이에서 경쟁력을 갖춰 나가고 있다”며 “OCR 기술을 지속적으로 고도화해, 네이버의 컴퓨터 비전 기술이 더욱 다양한 분야에서 활발히 활용될 수 있도록 연구를 이어갈 것”이라고 밝혔다.

<이대호 기자>ldhdd@ddaily.co.kr

이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널