보안

"AI로 공격하는 해커, AI로 막자"…KISA, 'AI데이터셋 구축사업' 추진

김보민 기자

해킹 이미지 [ⓒ픽사베이]

[디지털데일리 김보민기자] 한국인터넷진흥원(KISA)이 악성코드와 위협 프로파일링에 특화된 인공지능(AI) 데이터셋 구축 사업을 추진한다. 생성형 AI를 활용해 공격을 가하는 해커가 늘어난 만큼, 위협에 사전 대비할 수 있는 환경을 조성한다는 취지다.

13일 관련 업계에 따르면 KISA는 '사이버보안 AI 데이터셋 구축 및 활용 강화'라는 이름으로 사업 공고를 게시했다. 사업 규모는 45억원으로, 이달 14일 입찰이 시작된다.

이번 사업은 최신 악성코드와 위협 프로파일링에 특화된 AI 데이터셋 2종을 구축하는 것이 핵심이다. 최신 악성코드 데이터에는 생성형 AI를 악용한 위협 데이터가 포함돼야 한다.

최근 사이버 공격자들이 생성형 AI를 활용해 위협을 가하고 있는 만큼 '눈에는 눈, 이에는 이' 전략을 꾀한다는 취지다. 올 초 마이크로소프트(MS)와 챗GPT 개발사 오픈AI는 북한, 중국, 러시아, 이란 등과 연계된 해커 조직이 생성형 AI 서비스를 이용한다는 사실을 감지하고 이들 사이트를 차단했다는 사실을 밝히기도 했다. 생성형 AI 서비스로 사이버 공격 방법을 검색하거나 악성코드를 만드는 경우도 있다.

이러한 상황을 고려했을 때 생성형 AI 공격을 분류해 낼 수 있는 데이터 기반을 마련하는 것이 중요하다. KISA 측은 요청서를 통해 "단순 위협정보를 수집해 대응하던 기존 방식에서 벗어나, 데이터 간 연결성과 인사이트를 분석해 위협정보 형태의 AI 데이터셋을 활용하는 것이 필요해졌다"고 설명했다. AI가 만들어낼 수 있는 가짜 내용, 조작 정보, 왜곡 데이터를 식별하고 대응할 체계가 필요하다는 것이다.

AI 데이터셋은 공격 상황에 대한 설명과 우선순위를 파악할 수 있는 자동화 체계를 마련하는 데 힘을 보탤 전망이다. 현재 시만텍, 파이어아이, 맥아피 등 글로벌 보안 기업들은 위협 정보 수집 센서를 설치해 AI, 빅데이터 기술을 이용해 위협 분석을 시행하고 있다. 이러한 체계는 탐지는 물론 공격에 대한 의도를 해석하는 데 도움이 된다.

KISA는 이번 사업으로 정부와 민간 기업이 협력해 생성형 AI, 지능형지속위협(APT) 공격 도구, 랜섬웨어 등 국민 디지털 안전에 파급도가 높은 위협 데이터를 선제적으로 수집할 수 있을 것으로 보고 있다. 아울러 관련 데이터가 필요한 기업에 재료를 제공해 최신 위협에 대응할 수 있는 기틀 또한 마련할 수 있을 것으로 내다봤다. 사이버 침해 사고에 취약한 영세 혹은 중소기업이나, 정보기술(IT) 서비스 분야 기업 및 기관이 수혜를 볼 수 있다는 의미다.

최종 선정된 사업자는 악성코드와 위협 프로파일링에 대한 원시 데이터를 수집하고 최신화하는 작업을 수행한다. 원시데이터는 악성파일, 코드, 공격도구, 이메일 등에 대한 원본 파일을 뜻한다. 수집된 위협 데이터는 AI 모델 학습에 적합한 형태로 분석 및 가공된다. 이 과정에서 전처리, 민감정보 비식별, 라벨링 등 가공 작업이 진행된다.

KISA는 이번 사업을 통해 확보해야 할 데이터 규모 또한 명시했다. 먼저 악성코드 데이터셋의 경우 탐지 은닉, AI 악용 등 최신 공격 기법이 포함된 데이터 약 2억건을 수집해야 하는 것을 목표로 삼았다. 여기에는URL, IP, 도메인 등 관련 위협 데이터도 포함된다. 위협 프로파일링 데이터셋의 경우 국내외 알려진 APT 공격그룹 80개 이상을 선정하도록 했다. 공격그룹과 연관된 위협지표와 원시 데이터 약 1억건을 수집하는 것을 목표로 꼽았다.

KISA 측은 침해 대응 적용 방법론과 우수사례를 발굴해 국내 사이버보안 분야 AI 원천기술 성장 기반을 마련할 수 있을 것으로 전망했다.

김보민 기자
kimbm@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널