금융IT

비식별화된 금융 빅데이터…흥미롭지만 '비즈니스 자산화' 가능할까

박기록
[디지털데일리 박기록기자] 국내 대출(여신)시장에서 가장 문전박대를 당할 가능성이 있는 계층은 어디일까. '청년층'과 '노년층'이다.

한국신용정보원이 지난 15일 발표한 금융 빅데이터 분석 결과는 흥미롭다. 신용정보원이 비식별화 과정을 거쳐국내 일반 대출정보 3억9000만건과 보험신용정보 3억6000만건의 빅데이터를 결합해 보험가입 건수와 대출 연체율의 상관관계를 분석한 이 결과치는 금융회사가 대출 전략을 짜는데 유용해 보인다.

비록 일반 대출정보와 보험간의 연관 관계만으로 분석대상이 좁혀져 있다는 게 아쉽지만 지금까지 실증하기가 쉽지 않았던 대출-보험간의 상관 관계가 구체적으로 밝혀졌다.

구체적으로 보면, '청년층'은 학자금 대출이외에 다른 채무가 있는 다중채무자이거나 25세 이하의 신용카드 이용자, 보험 미가입자는 연체위험에 특별히 높은 겻으로 분석됐다. 즉 이런 조건을 가진 청년에게 대출을 해주면 부실이 될 확률이 높다는 의미다.

25세 이하의 청년층중에서 학자금 대출 말고도 다른 채무가 있다는 것은 그만큼 금전 상황이 곤궁하다는 의미를 가진다. 또 '25세 이하의 신용카드 사용자'라면 아직 취업을 못한 청년일 가능성이 높은데 소득은 낮아 상환능력 초과 이용으로 인한 카드결제 연체 발생 확률이 높다는 분석이 가능해진다. 이와함께 '보험 미가입자'가 연체발생율이 높은 이유 역시 보험을 들만큼의 금전적인 여유가 없다는 것을 반영한다.

특히 신용분석원은 이번 빅데이터 분석을 통해, 25세 이하의 대출자 남녀구성비에서 유일하게 여성이 남성보다 많다고 분석했다. 즉, 25세 이하의 여성이 소액대출 니즈가 상대적으로 강렬한다는 것을 의미한다. 이미 시장에선 젊은 여성을 대상으로 한 소액전문 대출 광고가 상당히 넘쳐나고 있는데, 실제 빅데이터 분석을 통해 이것이 입증되고 있는 것이다.

신용정보원은 한편 또 다른 대출 취약계층인 '노년층'의 경우 1000만원 이하의 소액대출을 받은 노년층 여성및 다중채무자의 경우 연체발생율 증가가 두드러진다고 분석했다. 이들 노년 계층에선 '생활비 용도 등으로 소액 대출보유자가 많고, 여기에 배우자 사망및 질병(노인성 질환) 등의 사유로 상환능력이 점차 약화돼 결국 연체율이 높아지는 과정이 그려진다.

◆금융 빅데이터 분석, 의미있는 결과치 = 신용정보원이 따로 언급하지는 않았지만 이번 빅데이터분석 결과는 우리 사회가 직면하고 있는 '청년실업의 심각성'이나 '노인 빈곤층'의 문제에 대한 적나라한 민낯이 '연체증가율'로 치환될 수 있다는 생각을 갖게 한다.

금융 당국은 이번 신용정보원의 빅데이터의 분석결과가 금융회사의 건전성 관리나 취약계층이나 핀테크기업 등을 위한 맞춤형 정책 개발의 기초자료로 활용될 수 있을 것으로 기대했다.

실제로도 개인 신용및 금융정보(대출, 보험)의 데이터 비식별화를 거쳐 생성된 빅데이터 분석 결과는 다양한 용도로 쓰일 수 있다. 대출 리스크가 큰 계층은 대출금리를 높게, 반대로 리스크가 낮은 계층은 대출금리를 낮게 적용할 수 있다.

현재 중금리대출시장 경쟁에 나서고 있는 금융회사나 P2P 업체들이 주로 신용도 검증이 가능한 직장인을 타깃으로 하고 있다. 건강보험공단 제출자료 또는 모바일 스크래핑 기술을 활용한 다양한 데이터 분석기법을 통해 대출이율 설정하고 있다.

이런 관점에서 본다면 신용정보원이 앞으로 주기적으로 제공하게될 전체 금융업권의 신용정보를 토대로 한 방대한 빅데이터 분석 정보는 금융회사에겐 보다 유용하게 사용될 수 있으로 보인다.

◆비식별 데이터의 분석, 대출에 얼마나 유용할까 = 하지만 이번 빅데이터 분석 결과가 기존보다는 훨씬 도움은 되겠지만 그렇다고 금융회사들의 갈증을 완전히 풀어줄 수 있는 수준으로 볼 수 있는지는 의문이다. 비식별화된 데이터를 기반으로 한 빅데이터 분석이 가지는 근본적인 한계때문이다. 정부의 금융및 사회복지 정책개발의 기초 자료로 활용하기에는 매우 유용하겠지만 금융회사나 핀테크 기업이 적극적으로 활용하기에는 아직은 아쉬움이 있어 보인다.

금융 당국은 이번 '일반신용-보험정보 연계 빅데이터 분석을 통해 금융회사의 리스크 평가모형 정교화를 지원하고, 소비자에게 합리적인 조건의 금융서비스를 제공할 수 있을 것'이라고 밝혔지만 이를 개인의 중대출 금리를 결정하는 데이터로 활용하기는 한계가 있다.

현재 P2P 중금리 대출의 경우, 관련 금융회사나 핀테크 기업들은 개인의 사전동의를 얻어 SNS(사회관계망서비스) 평판분석 등까지 체크해서 대출금리 산출의 근거로 활용한다. 물론 이런 방법을 동원해도 실제 현장에선 만족도가 높지는 않다.

결국 개인에 대한 빅데이터 분석 방법은 여전히 숙제로 남아있고, 이 부분을 채우기위해 다양한 시도가 이뤄지고 있다. 데이터가 아무리 크더라도 비식별화로 필터링된 데이터에 대한 매력은 떨어진다.

최근 신한은행은 SK플래닛과 P2P 금융 및 핀테크 사업 추진을 위한 ‘커머스 플랫폼(Commerce Platform) 기반 신금융서비스’ 업무협약을 체결한 바 있다. 국내 최대의 오픈마켓인 '11번가'에 입점한 7~8만개의 등록업체들을 대상으로 P2P방식의 대출을 제공하기 위한 신용평가 플랫폼을 만드는 것이 협약의 골자다. 신용평가플랫폼은 신한은행이 아니라 SK플래닛측에서 만든다.

즉, ‘11번가’에 입점한 수많은 등록 업체(가맹점)들을 잠재 대출 고객으로 보고, 그들의 매출(판매량) 데이터뿐만 아니라 고객들의 서비스 평판, 배송서비스 등 다양한 평가 데이터를 기반으로 한 신용평점 산출 시스템을 구축한 뒤 P2P 대출서비스에 나선다는 것이다.

국내 금융권의 대출(여신) 담당자들에게 '비식별화된 정보' 는 크게 어필하지 못하고 있는 게 현실이다. 비식별정보 기반의 비즈니스 모델 구현이 아직은 쉽지 않다고 보기때문이다.

때문에 신한은행-SK플래닛의 협력 사례처럼, 특정 업체나 개인의 평판 정보를 축적한 보다 직접적인 대출 정보를 추출할 수 있는 플랫폼을 원할 수 밖에 없다.

아직 시원한 해법을 찾지는 못했지만 비식별화된 빅데이터 분석 결과를 자산화할 수 있는 방법을 찾을 수 있다면 여기에서 승부가 갈릴것으로 보이지만 아직은 좀 더 지켜봐야 할 시점이라고 전문가들은 얘기하고 있다.
<박기록 기자>rock@ddaily.co.kr
박기록
rock@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널