e비즈*솔루션

팁코 “데이터 활용의 장벽, 데이터 가상화와 EDA로 허물 수 있다”

이종현
27일 발표 중인 닉 림 팁코 아태지역 총괄 사장
27일 발표 중인 닉 림 팁코 아태지역 총괄 사장
[디지털데일리 이종현기자] “누군가는 데이터를 새로운 원유라고도 말한다. 그야말로 데이터가 모든 것이 되고 있는 세상인데, 정작 많은 기업들은 데이터를 활용하는 데 어려움을 겪고 있다. 팁코는 이런 문제를 해결하고, 데이터를 바탕으로 더 빠르고 정확한 의사결정을 할 수 있도록 돕는 것을 목표로 한다.”(닉 림 팁코 아태지역 총괄 사장)

27일 팁코 소프트웨어(이하 팁코)는 최근 데이터 시장 트렌드와 자사의 솔루션 및 사업 전략을 소개하는 오프라인 기자 간담회를 개최했다. 닉 림(Nick Lim) 아태지역 총괄 사장과 주재영 한국지사장, 이석진 프리세일즈 상무 등이 발표를 진행했다.

팁코는 1997년 설립된 미국 기업이다. 곳곳에서 수집되는 데이터를 연결(Connect)하고 이를 통합(Unify)한 뒤 예측(Predict)하는, 데이터 라이프사이클 전반에 필요한 소프트웨어(SW)를 제공한다는 것이 닉 림 사장의 설명이다.

그는 “모두가 데이터를 잘 활용하는 것이 중요하다고 공감하지만 이를 실천하는 데는 해결해야 하는 문제가 많다”며 그 원인으로 데이터의 분산 및 유형 다양화, 신뢰성 등을 꼽았다.

통상 기업들은 데이터를 효율적으로 관리하기 위해 데이터베이스(DB)를 이용한다. 하나의 DB만 이용하는 것이 아니라 정보기술(IT) 환경이나 애플리케이션(앱) 성격 등에 따라 복수의 DB를 사용하기도 하는데, 이 과정에서 데이터가 지나치게 파편화돼 데이터 활용을 어렵게 한다는 주장이다.

활용되는 데이터의 유형이 달라진 것도 문제다. 과거에는 DB에 활용할 수 있도록 규칙화된 정형 데이터의 활용이 주를 이뤘다. 하지만 최근에는 문서나 이미지, 음성, 비디오 등 비정형 데이터까지 활용의 대상이 됐다. 또 이처럼 다양해진 데이터가 신뢰할 수 있는 데이터인지를 판별하는 것도 난관이다.

닉 림 총괄 사장은 “팁코는 ‘커넥티드 인텔리전스(Connected Intelligence)’라는 플랫폼을 바탕으로 고객들이 어려워 했던 데이터 활용을 지원한다. 이는 궁극적으로 더 빠르고 정확한 의사결정으로 이어질 것”이라고 피력했다.
1887년 스웨덴 스톡홀롬의 전화탑. 5500여개 회선을 하나의 전화탑에 집중화한 결과.
1887년 스웨덴 스톡홀롬의 전화탑. 5500여개 회선을 하나의 전화탑에 집중화한 결과.

◆흩어진 데이터, 데이터 가상화로 쉽게 접근

팁코가 특히 강조하는 기술은 데이터 가상화(Data Virtualization)다. 기업 IT 환경의 데이터 전반을 아우르는 층(Layer)을 만들고, 이를 통해 DB나 데이터웨어하우스(DW), 파일시스템, 클라우드 등 분산돼 있는 데이터에 빠르게 접근한다는 것이 기술의 기본 골자다.

통상 사일로(Silo) 형태로 나눠져 있는 데이터를 활용하려면 DB에서 DB로 옮길 때 추출·변환·로드(ETL) 과정을 거친다. ETL 과정에서 지연이 발생하고, 또 오리지널 데이터 외의 새로운 데이터를 중복으로 저장하게 돼 스토리지에 대한 부담도 커진다.

이석진 팁코코리아 프리세일즈 상무는 “데이터 사일로 문제를 해결하기 위해 등장한 것이 데이터레이크다. 분산돼 있는 데이터를 한 곳에 모은다는 개념인데. 데이터레이크를 구축하려 시도한 기업 중 열에 아홉은 호수(Lake)가 아니라 늪(Swamp)을 직면하게 된다”고 전했다. 방대한 데이터레이크에서 원하는 데이터를 빠르게 찾고, 활용하는 것이 쉽지 않기 때문이다.

이에 팁코는 데이터 가상화를 데이터레이크의 대체 혹은 보완적인 기술로 제안하는 중이다. 큰 부담 없이, 호환성 높은 가상화 기술을 통해 데이터에 대한 접근을 단순화하고, IT의 복잡성을 줄이라는 것이다. 실시간으로 처리하고, 굳이 저장할 필요가 없는 데이터는 데이터 가상화를 통해, 자주 활용되거나 꼭 필요한 데이터는 데이터레이크로 저장하는 등의 방식으로도 활용 가능하다.

이 상무는 성능 외 활용성 측면에서도 강점이 있다고 강조했다. 사용자 입장에서는 데이터가 어디에 저장돼 있는지 등을 신경쓰지 않고, 가상화된 데이터 레이어를 통해 자신의 필요에 따라 데이터 분석을 할 수 있는 환경을 만들 수 있다는 설명이다.

물론 데이터 가상화는 만능 기술이 아니다. DB에서 DB로 옮겨갈 때 ETL 과정이 있는 것처럼, 가상화된 데이터 레이어를 거치는 만큼 이 과정이 필요 없는 데이터레이크 또는 데이터웨어하우스 대비 속도 측면에서 느릴 수는 있다. 다만 대부분의 기업 환경에서 사용하기에 무리 없을 정도의 성능이 발휘된다는 것이 이 상무의 주장이다.

그는 “팁코의 데이터 가상화를 활용한 대표적인 기업이 백신 기업 화이자다. 화이자는 랩에서, 또 생산 라인에서 생성하는 데이터를 ETL 과정을 거쳐 활용하는 것이 아니라 가상화된 기술을 통해 활용하는 중”이라고 말했다.

이어서 “1887년 스웨덴 스톨홀롬은 하나의 전화탑에 5500개 회선을 집중화시켜 관리했다. 그리고 이 전화탑은 1913년 용도 폐기로 흉물화됐고, 광고 타워로 활용되다가 1952년 화재로 철거됐다. 오늘날 데이터를 한 곳으로 모으는 모습과 크게 다르지 않다. 팁코가 집중화가 아닌 가상화를 주장하는 이유”라고 부연했다.

◆데이터 중심 아키텍처(EDA), 그리고 고객데이터플랫폼(CDP)

데이터 가상화가 팁코의 통합(Unify) 부문을 대표하는 기술이라면, 이벤트 중심 아키텍처(EDA, Event Driven Architecture)는 연결(Connect)과 통합, 예측(Predict) 등 여러 기술 요소가 접목된 케이스다.

특정 행동(Event)의 데이터를 낱낱이, 실시간으로 분석하겠다는 수요는 제조 산업에서 먼저 적용된 케이스다. 각종 센서에서 수집되는 데이터를 실시간으로 분석함으로써 제품에 대한 품질을 높이고 장애가 발생하지 않도록 하는 등, 스마트팩토리 구현을 위한 필수적인 기술로 꼽힌다.

이 상무는 “큰 규모의 반도체 공장에 가면 많게는 1만개의 장비가 가동되는데, 이를 사람이 일일이 모니터링하는 것은 불가능하다”고 밝혔다.

최근에는 제조뿐만 아니라 금융이나 이커머스 산업에서도 이와 같은 기술을 도입하는 추세다. 고객데이터플랫폼(CDP, Customer Data Platfrom)이다. 고객의 실시간 행동을 분석해 개인화된 마케팅을 제공하는 것이 사용례다. 팁코의 경우 EDA를 금융, 제조, 유통, 통신 등 유형에 따라 제공하고 있다. 팁코 EDA의 한 갈래로 CDP가 자리하고 있는 셈이다.

이 상무는 “과거에는 1주 정도, 저장하다가 파기하던 고객의 행동 데이터가 이제는 분석하기 좋은, 가치 있는 데이터가 됐다. 일별, 주별 데이터 분석의 경우 ETL 과정을 거쳐서 분석을 할 수 있었지만 각종 데이터를 모두 실시간을 분석하는 데는 제약이 있다. 여기에 팁코가 제공하는 CDP를 적용할 경우 이벤트 수집부터 맞춤형 오퍼 발송까지 1초 내에 처리가 완료된다”고 피력했다.

팁코는 데이터 흐름 전반에 대한 솔루션을 지속해서 내놓는 중이다. 최근에는 인공지능(AI) 모델을 통해 앱에 대한 분석 적용, 편향 확인 및 완화 등을 제공하는 모델옵스(ModelOps)도 출시했다.

주재영 팁코코리아 지사장은 “데이터를 활용코자 하는 수요는 굉장히 늘어나고 있다. 하지만 데이터의 분산이나 실시간 처리 등을 지원하는 기술은 아직 초기 단계”라며 “파트너 생태계를 강화해 데이터 가상화와 EDA 등, 데이터 흐름 전반을 아우르는 팁코의 솔루션을 제공할 것”이라고 사업 전략을 소개했다.
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널