클라우드

구글 클라우드 “데이터 기반 혁신, 제한없는 데이터 클라우드 환경서 시작”

이종현

[디지털데일리 이종현기자] “지난 10년간 저희는 수집·저장되는 데이터의 양이 전례없이 증가하는 과정을 직접 경험했습니다. 하지만 무한히 증가하는 데이터와 달리 이에 대응하는 데이터 플랫폼에는 한계에 직면하고 있습니다. 구글 클라우드의 미션은 데이터와 가치 실현이라는 간극의 격차를 좁힐 수 있는 서비스를 제공하는 것입니다.”(황경태 구글 클라우드 커스터머 엔지니어링 매니저)

27일 구글 클라우드는 자사의 데이터 관련 비전 및 데이터 관련 클라우드 혁신 기술을 소개하는 온라인 기자간담회 ‘데이터 클라우드 서밋’을 진행했다.

행사에서 특히 강조한 것은 ‘빅레이크(BigLake)’다. 빅레이크는 데이터웨어하우스와 데이터레이크를 하나의 서비스로 통합한 제품이다. 데이터웨어하우스와 데이터레이크를 별도로 관리할 때 발생하는 중복 저장에 따른 비용 부담이나 데이터 사일로(Silo)를 해결할 수 있든 대안이 되리라는 것이 구글 클라우드의 설명이다.

데이터웨어하우스와 데이터레이크를 통합하는 것은 구글 클라우드 외 기업들도 추진 중이다. 데이터브릭스는 ‘레이크하우스(LakeHouse)’라는 명칭을 사용하는데, 빅레이크와 지향점이 같다. 스노우플레이크 역시 데이터웨어하우스에서 범위를 확장하며 레이크하우스 시장에서 경쟁하게 될 전망이다.

이와 관련 구글 클라우드는 차별화된 경쟁력으로 ‘빅쿼리(BigQuery)’를 꼽았다. 엔터프라이즈 데이터웨어하우스 성능을 데이터레이크 스토리지로 확장했다는 설명이다.

김정훈 구글 클라우드 데이터 애널리틱스 스페셜리스트
김정훈 구글 클라우드 데이터 애널리틱스 스페셜리스트

김정훈 구글 클라우드 데이터 애널리틱스 스페셜리스트는 “빅레이크는 경쟁사가 지원하는 모든 기능에 더해, 구글의 특장점인 스토리지 기술까지 함께 제공할 수 있다. 빅쿼리를 더 잘 활용할 수 있는 환경을 조성할 수 있는데, 이는 성능에서 굉장한 큰 차이로 이어진다”고 강조했다.

빅쿼리는 구글 클라우드의 최대 강점으로 꼽히는 기술이다. 빅쿼리를 이용하기 위해 구글 클라우드를 선택하는 기업도 적지 않다. 빅쿼리가 가진 강점을 빅레이크가 그대로 품음으로써 경쟁 우위를 가져간다는 전략이다.

이에 더해 기업들이 우려하는 ‘벤더 종속성’ 우려도 벗었다는 것이 구글 클라우드의 설명이다. 김정훈 스페셜리스트는 “빅쿼리는 표준 SQL을 이용한다. SQL 기능을 바탕으로 어디든 이식 가능하다”고 피력했다.

구글 클라우드에 따르면 트위터(Twitter)는 빅쿼리와 함께 빅레이크의 스토리지 기능을 이용해 데이터 제한 없이 트위터 사용자의 플랫폼 사용 현황과 콘텐츠 선호도를 파악하고 있다. 그 결과 초당 3백만개 이상의 집계를 실행하는 광고 파이프라인을 통해 매일 수조건에 달하는 이벤트와 관련된 콘텐츠를 제공하고 있다.

구글 클라우드는 이날 간담회에서는 구글 클라우드 데이터베이스(DB)인 스패너에 추가된 기능 ‘스패너 체인지 스트림’과 보다 쉽고 빠른 인공지능(AI) 모델 개발 및 유지보수를 지원하는 ‘버텍스 AI 워크벤치’, 통합형 비즈니스 인텔리전스(BI) 플랫폼 ‘루커용 커넥티드 시트’ 등도 소개했다.

구글 클라우드 황경태 엔지니어링팀 매니저는 “구글 클라우드의 경쟁력은 서비스의 규모와 깊이에 있다. 구글 클라우드 데이터베이스(DB)인 ‘스패너(Spanner)’는 최대 99.999%의 가용성에 더해 초당 최대 20억건 이상의 요청을 처리한다. 데이터 분석에서는 빅쿼리로 페타바이트(PB)급 환경을 구축하고, 초당 110TB 수준의 데이터를 분석·처리할 수 있다”고 전했다.

이어서 그는 “데이터는 무한히 늘고 있지만 대다수 데이터 플랫폼은 그렇지 못한 상황”이라며 “데이터에 기반한 혁신은 제한 없는 데이터 클라우드 환경에서 시작한다. 구글 클라우드는 모든 워크로드 전반에 걸쳐 데이터의 접근성과 도달 범위를 제한 없이 확장시키는 기술을 제공해 드리고자 한다”고 부연했다.

이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널