솔루션

‘위드 AI’ 시대, 어떻게 준비할까?…매스웍스 “매트랩으로 손쉽게 인공지능 모델 개발”

박현영


[디지털데일리 박현영기자] 인공지능(AI)이 대부분의 산업에 도입되는 ‘위드 AI’ 시대가 도래했지만, 여전히 많은 기업들이 AI 도입 시 어려움을 겪고 있다. 담당 직원이 부재하거나, AI 모델링을 위해 필요한 데이터의 질이 낮아서 어려움을 겪는 경우도 흔하다.

하지만 가장 흔한 경우는 ‘사일로(Functional Silos)’로 인한 어려움이다. 사일로란 회사 내에서 외부와 소통하지 않는 부서를 가리키는 말이다. ‘기능적인 사일로’란 부서별로 담당하는 기능이 정확히 정해져 있어, 협업하는 환경이 마련되어있지 않은 것을 의미한다. 특히 인공지능 시스템을 개발할 때는 여러 단계가 필요한데, 각 단계를 한꺼번에 커버하는 플랫폼이 존재하지 않는 경우가 많다.

매스웍스는 이 사일로 문제를 해결해 인공지능 시스템을 개발할 수 있는 플랫폼 ‘매트랩(MATLAB)’을 제공하고 있다. 송완빈 매스웍스코리아 과장은 지난 17일 디지털데일리 온라인 컨퍼런스 플랫폼 DD튜브에서 열린 웨비나에서 인공지능 시스템 개발의 과정과 함께 매트랩의 강점을 소개했다.

송 과장은 “전체 워크플로우를 하나의 플랫폼에 담아 기능적인 사일로를 해결했다”며 “누구나 손쉽게 개발할 수 있는 환경을 제공하는 게 매트랩의 강점”이라고 강조했다.

◆인공지능 개발 시 데이터가 제일 중요…“전처리‧라벨링 작업 지원”

인공지능 시스템을 설계하는 워크플로우는 크게 네 단계로 구성된다. ▲인공지능 학습에 쓰일 데이터를 모으는 데이터 준비 과정 ▲알고리즘을 적용해 인공지능 프로그램을 만드는 AI 모델링 ▲만들어진 모델을 기반으로 실행하는 시뮬레이션 테스트 ▲실제 모델을 배포하는 과정 등이다.

우선 1단계인 데이터 준비 과정에서 중요한 건 데이터를 전처리하는 작업이다. 예를 들어 신호나 음성 데이터는 노이즈를 없애는 전처리 작업이 필요하다. 영상도 전처리가 필요한데, 영상에서 관심 있는 부분만 따내는 작업이 대표적이다. 송 과장은 “인공지능 모델을 개발할 땐 80%의 노력을 데이터 준비에 써야 한다”며 이 같은 준비 작업이 중요함을 강조했다.

데이터를 라벨링하는 작업 역시 필수다. 라벨링이란 인공지능이 학습할 수 있도록 데이터에 대한 정보를 미리 달아주는 것을 말한다. 사람 이미지에 ‘사람’으로 분류할 수 있도록 주석을 달아주는 식이다.

송 과장은 라벨링에 대해 “데이터가 1000개 있으면 1000개에 대한 정답을 미리 달아주는 반복적인 작업”이라고 묘사했다. 반복적인 작업인 만큼 데이터 라벨링만을 위해 외주 업체를 쓰는 기업도 있을 정도다.

송 과장은 “매트랩은 여러 라벨링 툴을 가지고 영상, 이미지, 신호 모두 라벨링이 가능하다”고 설명했다. 이어 “라벨링을 할 때는 일관적으로 하는 게 중요한데, 이를 위해 알고리즘을 활용할 수 있다”며 “나만의 알고리즘을 끌어와서 라벨링하는 것도 가능하다”고 덧붙였다.

◆AI 모델링, 전이학습 모델 제공…“모델링부터 배포까지 모든 과정 앱 기반”

이렇게 데이터 준비 작업을 마치면 알고리즘을 적용해 본격적으로 AI 모델링을 해야 한다. 매트랩에선 머신러닝, 딥러닝, 강화학습 등 여러 알고리즘을 활용할 수 있으며, 딥러닝 기반 모델도 쉽게 학습할 수 있도록 앱 기반으로 워크플로우를 지원한다.

만약 머신러닝 알고리즘을 활용하고자 한다면, 여러 머신러닝 알고리즘 중 어떤 게 적합한지 찾아야 한다. 매트랩은 이 과정을 편리하게 하기 위해 모든 알고리즘을 병렬로 학습해보도록 지원한다. 사용자는 입력한 데이터를 가지고 각각의 알고리즘을 적용해본 뒤, 그 결과를 확인해 어떤 게 적합한 알고리즘인지 결정할 수 있다.

딥러닝의 경우, 영상에 딥러닝 알고리즘을 적용해 AI 모델을 만들 때 크게 세 가지의 판별 모델이 있다. ▲이미지 분류(Image Classification) ▲객체 탐지(Object Detection) ▲시멘틱 분할(Semantic Segmentation, 픽셀 단위로 분활하는 것) 등이다.

이 때 이미지 분류 모델을 만들 땐 한 땀 한 땀 수백 만개의 영상을 준비해 학습하게끔 하는 방식도 있으나, ‘전이학습’이 유용하게 쓰인다. 전이학습이란 누군가가 만들어놓은 모델을 가져와서 내 작업에 알맞게 튜닝하는 것을 말한다. 즉, 이미 학습된 모델을 가져와서 일부만 바꾸는 것이다.

송 과장은 “매트랩에서는 누군가 만들어놓은 학습된 모델들도 제공한다”고 설명했다. 전이학습을 적용해 이미지 분류 모델을 만든 사례로는 일본 엔지니어링 기업 무사시의 사례를 들었다. 무사시는 결함이 있는 너트를 찾을 때 전이학습을 적용해 만든 이미지 분류 모델을 활용하고 있다.

영상 안에서 객체의 위치를 찾는 객체 탐지 모델을 만들 때도 마찬가지다. 미리 학습된 객체 탐지 모델을 불러와서, 빌트인(Bulit-in)된 함수들을 이용해 객체 탐지 모델을 설계 및 수정할 수 있다. 일례로 석유화학기업 쉴(Shell)은 태그 인식에 이렇게 개발한 객체 탐지 모델을 사용하고 있다.

마지막으로 영상을 픽셀 단위로 분류하는 시맨틱 분할 모델은 한국에서 딥러닝 알고리즘으로 가장 많은 사례를 배출한 모델이기도 하다. 마찬가지로 이미 만들어진 모델을 활용해 개발 가능하다. 매트랩은 깃허브 사이트에서 모델을 제공하고 있다. 사용자는 매트랩 깃허브에서 원하는 모델을 찾은 뒤, 매트랩 앱에 복사한 깃허브 주소를 넣고 활용할 수 있다. 일례로 현대제철이 철강 영상을 분석할 때 각 광물의 성문을 분석하는 데 이 시맨틱 분할 모델을 활용하고 있다.

이 같은 AI 모델링 단계를 통해 모델을 만들었다면, 이를 시뮬레이션 테스트해본 뒤 배포해야 한다. 배포 시에는 어디에 배포하는지에 따라, 즉 타깃에 따라 코드가 달라지게 된다.

이에 대해 송 과장은 “매트랩은 각 타깃에 맞게 코드를 변환해주는 자동 코드 생성 기능을 가지고 있다”며 “예를 들어 LG에너지솔루션은 딥러닝 기반으로 설비 고장 진잔 작업을 수행하고, exe 파일 형식으로 공장에 배포했다. 이 모든 워크플로우는 앱 기반으로 개발했다”고 강조했다.

박현영
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널