컨버전스

KT AI원팀, 사람처럼 사고하는 인공지능 모델 내년 상용화

최민지

[디지털데일리 최민지기자] 인공지능(AI) 1등 대한민국을 목표로 지난해 출범한 KT ‘AI원팀’이 이번엔 다자간 공동연구를 통해 초거대 AI 모델 개발에 나선다. 초거대 AI는 대용량 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 인공지능을 의미한다.

KT(대표 구현모)는 한국전자통신연구원(ETRI), 한국과학기술원(KAIST), 한양대와 ‘초거대 AI 모델’을 개발하기 위한 공동 연구협약을 체결했다고 18일 밝혔다.

이번 프로젝트는 각 기관에서 자연어 처리 분야를 대표하는 국내 최고 연구진으로 구성됐으며, KT의 오랜 사업 경험과 풍부한 데이터를 활용해 초거대 AI 모델을 개발하게 된다.

초거대 AI 언어모델은 매우 빠르게 발전하고 있으며 데이터 정제, 학습 알고리즘, 분산‧병렬학습, 경량화, 응용모델 발굴 등 다양한 분야 연구가 필요해 단일 기업이 단독으로 추진하기는 어렵다. 학교와 연구기관에서는 AI 연구를 위한 대규모 그래픽처리장치(GPU) 인프라에 접근하기 쉽지 않다.

이에 AI원팀은 기업의 대규모 투자를 통해 GPU 인프라를 구축하고, 학교와 연구기관은 최신 연구 동향을 반영한 기술을 제공하는 이상적인 산∙학∙연 협력 모델을 적용한다. AI원팀은 초거대 AI 모델 확보를 대한민국 AI 경쟁력 확보를 위한 핵심 의제로 설정하고 약 6개월 이상 실무 논의와 협력을 지속해 왔다. 이번 협약 체결로 기관별 역할을 정의하고 본격적 프로젝트 수행에 나선다는 계획이다.

KT는 다른 참여기관들과 힘을 모아 대규모 GPU 인프라 구축, 데이터 수집‧분석, 모델 학습, 응용태스크 적용 등 연구개발(R&D) 및 상용화 관련 업무를 총괄적으로 수행한다. KAIST는 머신러닝 알고리즘 최적화 및 어플리케이션 파트를 맡는다. 한양대는 데이터 정제‧필터링 알고리즘 개발, 분산‧병렬 알고리즘 및 모델 최적화 분야에서 힘을 보탠다. ETRI는 대형 모델학습 및 모델개발 분야에 참여한다.

AI원팀은 올해 말까지 1차로 초거대 AI의 학습을 완료하고, 내년 상반기 초거대 AI모델을 상용화한다는 목표다. 대규모 AI 연산 인프라를 구축하고, 향후 2000억파라미터(매개변수) 이상 모델까지 가능하도록 인프라 규모를 점진적으로 확대할 예정이다.

연구진은 학습데이터 필터링 강화, 데이터 간 균형 조정 등을 통해 AI 편향성을 우선 제거하는 한편, 유해 콘텐츠 필터링 기술 등 다양한 딥러닝 기반 탐지 기술을 적극 활용해 AI 윤리 이슈도 사전에 차단한다.

특히, 이번에 개발하는 초거대 언어모델은 즉시 상용화 가능한 ‘과제 지향적(Task-Oriented)’ 형태로 설계된다. 초거대 언어모델을 통해 향상된 음성인식(STT), 음성합성(TTS), 텍스트 분석(TA), 대화 등 요소기술은 먼저 KT 기가지니와 AI컨택센터(AICC) 서비스 고도화를 위해 활용된다. 이어 제조, 금융, 물류, 유통 등 참여기업의 다양한 사업 분야에 적용한다.

향후 AI원팀은 영상‧로봇 등 복합인지, 이미지 기반 해석, 인간중심 AI 등에서 초거대 AI 모델로 영역을 확장한다. 국내외 많은 기업과 학교, 연구기관이 AI원팀 초거대 모델을 활용해 한국어 언어지능에 손쉽게 접근하고, 이를 다양한 산업분야에 활용하도록 지원할 방침이다.
최민지
cmj@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널