클라우드

클라우드 데이터 시장 장악 중인 눈송이, ‘스노우플레이크’

이종현
왼쪽부터 스노우플레이크 코리아 유해웅 기술총괄 이사, 강형준 지사장
왼쪽부터 스노우플레이크 코리아 유해웅 기술총괄 이사, 강형준 지사장
[디지털데일리 이종현기자] 정보기술(IT) 인프라의 주축이 클라우드로 옮겨가고 있다. 온프레미스와 퍼블릭 클라우드를 함께 쓰는 하이브리드 클라우드, 복수의 퍼블릭 클라우드를 사용하는 멀티 클라우드가 일상화된 가운데, 클라우드에서 얻는 데이터를 효과적으로 수집·관리하도록 지원하는 기업 ‘스노우플레이크’가 영향력을 키우고 있다.

스노우플레이크는 클라우드에서 생성되는 데이터를 관리하는 플랫폼 기업이다. 여러 경로에서 생성되는 데이터를 통합, 쉽게 활용할 수 있도록 하는 역할을 수행한다.

강형준 스노우플레이크 코리아 지사장은 지난 11일 그룹 인터뷰에서 “스노우플레이크가 지향하는 것은 데이터 시장에서의 월드와이드웹(WWW)이 되는 것”이라며 “개인 또는 기업이 데이터를 쓰고 싶을 때 스노우플레이크에서 검색하고 활용할 수 있는, 그런 미래를 꿈꾼다”고 기업 청사진을 소개했다.

스노우플레이크의 핵심 영역은 데이터 웨어하우스(DW)다. DW는 종종 데이터 레이크와 혼동되는데, 데이터를 가공해서 저장하느냐, 원시(로우, Raw) 데이터로 저장하느냐에 따라 DW와 데이터 레이크가 구분된다. 다만 최근에는 DW가 비정형, 반정형 데이터까지 커버하게 됨에 따라 경계가 다소 무너지고 있다는 것이 강 지사장의 설명이다.

스노우플레이크가 제시하는 것은 ‘데이터 사일로 현상의 해결’이다.

기업들이 복수의 클라우드를 활용함에 따라 여러 경로에서 데이터가 수집되고 있다. 문제는 A 클라우드에서 수집한 데이터를 B 클라우드에 활용코자 할 때 장벽이 생긴다는 점이다. 데이터를 갖고도 못 쓰는 상황이 생겨나고, 이는 하이브리드·멀티 클라우드가 확산될수록 더 많아지게 된다.

이에 스노우플레이크는 자체 아키텍처를 통해 아마존웹서비스(AWS), 마이크로소프트(MS) 애저(Azure), 구글 클라우드의 데이터를 한데 모아 관리·활용할 수 있도록 한다. 온프레미스로 구축되던 여타 DW와 달리 클라우드 DW로 시장에서 존재감을 드러내고 있다.

‘아마존 레드시프트’, ‘구글 빅쿼리’ 등 경쟁 제품과 비교했을 때 넓은 범용성이 장점이다. 레드시프트나 빅쿼리의 경우 자사 클라우드에서 생성된 데이터의 수집·분석은 용이하나 타사 클라우드와의 호환성이 낮은 반면, 스노우플레이크는 특정 클라우드 사업자에 종속되지 않는다는 것을 강점으로 내세운다.

강 지사장은 “데이터를 제대로 활용하기 위해서는 활용코자 하는 데이터가 깨끗해야 한다. 데이터 엔지니어와 데이터 사이언티스트가 보는 데이터가 같아야 한다는 의미다. 데이터에 대한 통합이 이뤄지지 않는다면 데이터를 활용하는 것은 요원한 일”이라고 전했다.

서비스가 DW에만 국한되지는 않는다. 스노우플레이크는 데이터 레이크 시장으로도 사업을 확대했다. 데이터를 수집하고, 이를 활용할 수 있는 형태로 가공한 뒤 처리까지 지원한다.

강 지사장은 “스노우플레이크는 스스로를 데이터 웨어하우스(DW) 기업이라고 자칭하지 않는다. 데이터 클라우드 기업이라고 말한다. DW는 스노우플레이크의 사업 영역 중 하나일 뿐”이라며 “모든 데이터를 통합하는 하나의 매개체가 되는 것이 스노우플레이크의 목표”라고 피력했다.

스노우플레이크의 방향성을 엿볼 수 있는 것이 작년 출시한 ‘스노우파크’다. 기존에는 자바(Java), 파이썬(Python) 등 사용하는 프로그래밍 언어에 따라 클러스터를 분리해 사용해야 했는데, 스노우파크는 자바나 파이썬, 스칼라(Scala) 등 다양한 언어를 하나의 플랫폼에서 지원한다.

유해웅 스노우플레이크 코리아 기술총괄 이사는 “스노우파크를 통해 고객들은 모든 작업을 스노우플레이크가 제공하는 환경에서 처리할 수 있다. 이는 아키텍처 간소화, 최적화된 파이프라인 구축, 보안에 대한 신뢰 향상이라는 이점으로 이어진다”고 말했다.

강 지사장은 “기업들은 위험관리 차원에서도 복수의 클라우드를 사용하는 추세다. 클라우드의 활용도가 높아질수록 스노우플레이크도 성장할 수밖에 없다”며 “흩어져 있는 데이터를 한데 모으고자 하는 수요는 지속해서 생겨날 거고, 그때 가장 좋은 답을 제시하는 것이 스노우플레이크라고 자신한다”고 전했다.
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널