소프트웨어

요즘 뜨는 ‘그래프 DB’ 뭐길래…카카오·아마존부터 스타트업까지

백지영

<출처: AWS>
<출처: AWS>
[디지털데일리 백지영기자] 최근 금융, 제조, 의료 등 다양한 산업군에서 그래프 데이터베이스(Graph Database, 이하 그래프 DB)를 활용하는 사례가 늘고 있다. 특히 금융권의 경우 이상거래탐지(FDS)나 상품추천 등에 적용하는 것을 검토하고 있는 곳이 많아지고 있는 것으로 나타났다.

이에 따라 그래프 DB를 제공하는 업체도 늘고 있다. 카카오의 경우 2016년 자체 개발한 그래프 DB ‘S2’를 오픈소스로 공개했으며, 클라우드 서비스 기업 아마존웹서비스(AWS)는 지난해 말 그래프 DB ‘아마존 넵튠’을 출시했다. 국내 유일의 그래프 DB 스타트업인 비트나인은 2016년 미국법인을 설립하며 ‘아젠스그래프’의 해외영업을 본격화하고 있다. IBM, 오라클 등 주요 IT기업들도 그래프DB를 하나의 오퍼링으로 제공하고 있다.

그렇다면 그래프 DB는 무엇일까. 그래프 DB는 그래프 이론에 토대를 둔 일종의 NoSQL 계열의 DB다. 기존 관계형 DB는 데이터를 열과 행으로 저장하고, NoSQL DB는 비디오, 사진 등을 비롯한 방대한 비정형 데이터를 저장하는 용도다.

그래프 DB는 여기서 한걸음 더 나아가 각 데이터 포인트를 연결해 데이터 네트워크를 만든다. 즉, 데이터 자체를 점과 선의 그래프 형태로 저장해 특정 패턴과 이상 현상을 빠르게 추적할 수 있다.

이를테면 소셜네트워크 상에선 사용자 간 관계를 정의하고, 친구관계를 맺은 사람이 무엇을 좋아하고, 구매하고, 공유하고, 댓글을 달았는지 등을 표시해주고 이를 효율적으로 저장한다. 성향이 비슷한 사람들을 연결해 이들이 듣는 음악이나 아이템을 추천해주는 식의 적용도 가능하다.

실제 그래프 DB는 지난 2016년 전세계를 떠들썩하게 했던 국제탐사보도언론인협회(ICIJ)의 ‘파나마 페이퍼’에 활용되며 주목을 받았다. ‘파나마 페이퍼’는 파나마 최대 로펌인 모색폰세카의 내부자료 1150만 건을 분석해 조세 회피를 위해 페이퍼 컴퍼니를 설립한 것으로 의심되는 유명인들을 폭로한 프로젝트다.

당시 ICUJ가 입수한 문건은 2.6TB에 달했는데, 이를 분석하는 것이 쉽지 않았다. 그러다가 오픈소스 그래프 DB인 ‘네오포제이(Neo4j)’를 활용해 데이터를 그래프로 구현, 시각화하는데 성공했고 관련된 사람과 금융기관 간 흐름을 쉽게 파악할 수 있었다.

이처럼 소셜네트워크 등에서 주로 사용되던 그래프 DB는 데이터의 폭발적인 증가와 함께 데이터 간 연결성, 패턴 분석 등이 중요해지면서 상품추천시스템부터 인공지능(AI), 금융사기방지 등 다양한 분야에 활용되고 있다.

시장조사기관 IDC에 따르면 전세계 DB 시장은 매년 6~7% 성장하고 있는 가운데, 그래프 DB 시장은 매년 40% 이상 규모가 커지고 있는 것으로 분석됐다. 물론 NoSQL 시장에서 그래프 DB가 차지하는 비중은 약 3%에 불과하다.

박준성 비트나인 팀장은 “그래프 DB는 단순히 데이터 정보를 질의응답하는 것을 넘어, 데이터의 복잡한 관계를 보다 쉽고 빠르게 파악할 수 있도록 도와주는 것이 특징”이라며 “최근 미국에서 열린 DB 관련 컨퍼런스에 참여했는데 해외 고객도 가장 관심이 큰 분야가 금융권 이상거래탐지, 상품추천 순이었다. 관계형 DB를 대체하기보다는 이를 보완하는 형태로 발전하고 있다”고 설명했다.

<백지영 기자>jyp@ddaily.co.kr

백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널