보안

S2W, 자연어처리 학회에 2년 연속 논문 등재

이종현

[디지털데일리 이종현기자] 데이터 인텔리전스 기업 S2W는 자사에서 저술한 논문이 자연어처리(NLP) 분야 최고 권위의 국제 학회에 2년 연속으로 등재됐다고 4일 밝혔다.

S2W는 지난 2022년에 NLP 분야 국제 3대 학술대회 중 하나로 꼽히는 북미 지역 NAACL에서 ‘다크웹 언어에 대한 새로운 조명(Shedding New Light on the Language of the DarkWeb)’ 논문을 발표했다.

또 올해는 컴퓨터과학 및 인공지능(AI) 학술대회인 ACL에서 ‘다크버트: 인터넷의 어두운 단면을 위한 언어 모델(DarkBERT: A Language Model for the Dark Side of the Internet)’ 논문을 발표한다. S2W는 이번 논문 준비를 위해 독자적으로 보유한 다크웹 수집, 정제, 분석 엔진과 범용언어모델 버트(BERT)를 이용해 다크웹에 특화된 언어모델 ‘다크버트’를 제작했다고 전했다.

다크버트는 최근 다양한 사이버 범죄 및 위협의 주요 원인으로 꼽히는 다크웹에서 음란물, 총기류, 마약 등의 콘텐츠를 자동으로 분류하고, 각종 사이버 위협과 관련된 키워드를 추론하는데 이용할 수 있다. 기밀 정보 유출 사이트를 탐지하고 해킹포럼 내 중요 게시물을 분류하는 등 다양한 유형의 범죄 활동을 탐지하고 분석하는데 있어 기존의 범용 언어모델보다 우월한 성능을 자랑한다는 설명이다.

이는 S2W AI팀의 장우진, 정진우, 최건, 이용재 연구원이 KAIST 연구팀과 공동으로 성공적인 결과를 이끌어낸 주역이다.

S2W는 이러한 다크버트에 대한 설명과 관련된 벤치마크 데이터를 오는 6월 열릴 자체 정기 웨비나 ‘위드(With)’와 정기 오프라인 세미나 ‘SIS 2023’을 통해 대중에 공개할 방침이다.

S2W 관계자는 “국내 사이버보안 업체가 2년 연속으로 NLP 국제적인 대표 학회에서 논문을 발표한 것은 이번이 처음이다. S2W는 이번 논문 발표로 앞으로도 국내는 물론 글로벌 사이버보안 업계의 선두 주자로서 기술 발전과 보안에 지속적으로 기여할 것”이라고 말했다.

이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널