SKT-한화생명, 비식별화된 개인정보 적극 활용...결과 주목
[디지털데일리 최민지기자] SK텔레콤과 한화생명이 개인정보 비식별화에 동참하고 데이터 결합을 통한 새로운 도전에 나설 준비를 마쳤다.
11일 한국인터넷진흥원(KISA, 원장 백기승)은 4차 산업혁명 및 빅데이터 시대 변화에 따라 개인을 식별할 수 있는 요소를 제거한 빅데이터의 안전한 결합을 활성화하기 위해 ‘2017 개인정보 비식별 조치 및 결합지원 서비스 설명회’를 서울 중앙우체국에서 개최했다.
이 자리에서 SK텔레콤과 한화생명은 비식별 정보를 결합한 실제 사례를 제시했다. 양사는 올해 1월말 사전협의를 진행한 후 2월부터 평가단 구성 및 적정성 평가를 실시했다. 지난달부터는 데이터 결합 완료와 데이터 분석을 시행했다.
◆SKT-한화생명, 보험·통신정보 시너지는? = 양사는 보험과 통신 간 상관관계 분석을 통해 데이터의 연계 활용 가능성을 검증하고자 데이터 결합을 시도했다.
이를 통해 금융거래 정보가 거의 없는 이들에 대한 신용평가도 제시할 수 있을 전망이다. 금융거래 내역이 없어도 통신사 연체 기록 및 거래정보 등을 활용할 수 있기 때문. 이는 비식별 결합 데이터를 활용한 대체(Alternative) 신용평가 모형 개발 가능성 분석으로 이어진다.
신용카드 실적이나 통장잔고 등 금융거래 내역만으로 대출자 상환능력을 평가하는 전통모델을 보완하고자 전기요금, 보험료, 통신요금 등 대체정보로 불리는 비 금융정보를 활용해 대출자의 신용도를 평가하는 모델이다.
이 경우, 신용평가 모델을 세분화해 신용정보를 보유하지 않은 청년층의 대출 기회를 넓힐 수 있게 된다.
양사는 SK텔레콤과 한화생명에 동시 가입된 약 218만명을 대상으로 데이터 결합을 진행했다. 고객정보, 신용정보, 거래정보 등 각각 21개 항목을 제공해 총 42개 항목을 결합했다.
한화생명에서는 ▲직업 ▲신용대출건수 ▲총신용대출금액 ▲최근신용등급 등, SK텔레콤에서는 ▲통신료 연체금액 ▲멤버쉽 사용금액 ▲통신료 미납횟수 등이 포함됐다.
데이터를 결합해 분석한 결과 추정소득, 보험계약해지, 보험료 연체, 보험약관대출 등 보험사 정보는 고객의 통신요금 연체발생을 판단할 수 있는 보조정보로 활용될 가치가 있는 것으로 나타났다. 통신료 연체발생률이 높을수록, 평균 이용정기 기간이 길수록 하위등급에 속했다.
하위등급의 21%는 통신료 납부방법을 입금전용·지로납부를 선택했는데, 상위등급의 경우 3.7%에 불과하다. 하위등급의 35.6%는 결합상품에 가입했고, 상위등급은 이보다 약 10%p 많은 45.4%다.
이에 한화생명은 이러한 비식별 결합 데이터를 활용해 CB신용 등급을 세분화하고 신용대출 연체 고객의 특성을 분석해 효율적으로 관리할 수 있을 것으로 내다봤다.
◆한화생명, 손해보험사와 데이터 결합해 자동차 변수까지 얻어=이와 함께 한화생명은 A손해보험사와 지난해 11월부터 개인정보 비식별화 준비를 시작했다. 양사에 동시에 가입된 고객 약 88만명에 대한 분석을 진행했으며 한화생명 19개, A손해보험사 41개, 총 60개 항목에 대한 총결합 데이터를 도출했다.
보험종류별 가입건수, 가입금액, 가입채널 등 공통 항목에 들어갔다. 한화생명의 경우 직업 기반 추정소득금액, 주소 기반 추정소득 금액, 추정주택 가격, A손해보험사는 자동차 외자체 여부, 보유한 차량대수, 자동차 가격 등이 포함됐다.
데이터 결합에 따른 분석 결과 차량가액이 커질수록 월 보험료가 높아졌고, 소득수준이 높을수록 납입 보험료가 커졌다.
한화생명 측은 “보험 우량 고객에 대한 이해도를 제고하고, 자동차 관련 변수까지 분석할 수 있을 것”이라며 “분포 비교와 특성 도출을 통해 마케팅에도 활용 가능하다”고 말했다.
◆SKT, 의료부터 복지까지 활용도↑=SK텔레콤은 지난해 8월부터 미래성장동력 플래그십 과제의 일환으로 ‘개인정보 비식별화 및 데이터 유통 실증과제’를 시작했다. 이 과제는 오는 30일까지 진행된다.
SK텔레콤은 이번 과제를 통해 개인정보 비식별 자료 생성 및 재식별화 불가 검증, 데이터 유통플랫폼 구축 및 거래 실증, 활성화를 위한 규제 개선점을 도출한다.
우선, SK텔레콤은 통신 데이터를 가공한다. 가입자 연체 및 신용도 유관 데이터, 장애인·외국인 체류지·체류시간 데이터를 개발·가공해 10만~15만건의 샘플 데이터를 제공한다. 또한, ‘스마트 인사이트&빅데이터 허브’를 활용한 거래 환경 플랫폼을 오는 17일 선보일 방침이다.
이날 SK텔레콤이 공개한 홍보영상을 보면 비식별 처리된 데이터는 의료분야부터 복지, 부동산 등 다양한 분야에 이용 가능하다.
2009년 구글은 데이터 분석을 통해 독감 발생지역을 실시간 예측해 미국의 질병통제예방센터보다 2주 앞서 독감발생을 예고할 수 있었다. 이러한 데이터를 의료기관과 연결하면 최적의 예산으로 국민건강복지를 향상시킬 수 있다는 입장이다.
사물인터넷 기반 전기 사용량 데이터를 지역단위로 통합시키면 지역 전기공급에 대한 조율이 가능해지고, 기후와 교통량·이주 인구 등의 데이터를 결합해 부동산 계획에도 활용 가능하다.
한국을 찾은 외국인들의 로밍현황을 조사해 체류지와 체류시간, 관광동선을 분석하면 최적의 마케팅을 실시할 수 있다. 또, 장애인 등급과 체류지, 체류시간을 확인해 장애인 지원 택시 경로 설정 등 효율적인 복지 지원정책을 설정할 수 있다.
SK텔레콤 측은 “한화생명을 비롯한 신용평가사 등과 한정된 데이터가 아닌 통신 데이터까지 반영해 유의미한 결과를 얻을 수 있었다”며 “과천과학관에 인공지능 스피커 ‘누구’를 통해 인식 제고와 연구성과 홍보를 진행할 예정이고, 현 제도의 운영 개선 포인트도 도출하겠다”고 제언했다.
◆개인정보 비식별화, 가치 있지만 아직은 아쉽다=이날 참가자들은 개인정보 비식별화에 대한 필요성에 공감하면서도, 한계에 대해서도 분명히 했다.
중복 고객만 결합이 가능하기 때문에 미보유 고객으로는 정보를 수집할 수 없고, 항목이 많아질수록 평가기준 충족을 위한 추가 구간화 및 범주화로 데이터 정확성이 저하된다는 것이다. 또, 평가단의 평가기준을 통과하기 위한 반복적 비식별 처리 업무에 대한 비효율성도 지적됐다.
한화생명 측은 “직접 방문해서 접수해야 하는 등 구시대적 절차를 개선해 다수 신청서 및 확인서를 통합하고 기관 간 데이터 송수신 핫라인을 구축해 불필요한 절차를 삭제했으면 한다”고 꼬집었다.
한국신용정보원도 세부적인 프로세스를 수립하면서 적정성 평가를 진행해야 하기 때문에 적정성 평가에 시간 소요가 많은 점을 문제점으로 꼽았다. 가이드라인의 세부절차 부재로 평가위원 간 세부 프로세스 합의에 불필요한 시간이 걸리기 때문이다. 두 번의 적정성 평가로 인해 데이터 손실량이 많아 효용성이 저하되는 점에 대해서도 우려했다.
한국신용정보원 측은 “가이드라인에 대한 기대와 현장 적용 간 간극이 존재하며, 가이드라인으로의 법적 한계가 있다”고 지적했다.
이에 대해 한국인터넷진흥원은 한국신용정보원 등 개인정보 비식별 관련 전문기관 및 정부 등과 가이드라인을 개정 건의를 추진할 방침이다. 빅데이터 활용 활성화 토대 마련으 위해서라도 내년부터 법적 효력을 갖춘 개정안으로 격상시킬 필요성이 제기된다는 것이다.
김원 한국인터넷진흥원 개인정보보호본부장은 “필요하다면 관계부처에 요청해 내년부터 개정에 대해 말하려고 한다”며 “우리사회는 정보라는 에너지원을 두고 다투게 될 4차 산업혁명 시대에 직면해 있어, 개인정보의 보호와 활용에 대한 균형 있는 논의가 필요하다”고 강조했다.
<최민지 기자>cmj@ddaily.co.kr
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18