대안신용평가 등으로 주목받는 금융AI, "데이터 품질 확보 없인 발전 없다"
[디지털데일리 오병훈기자] “금융과 인공지능(AI)이 결합할 때 가장 큰 문제점은 바로 ‘불균형한 데이터’다. AI를 활용한 신용평가 및 로보어드바이저(RA) 등 분야에서 수준 높은 발전을 위해서는 데이터 부재, 데이터 불균형 문제를 해결해야 한다.”
10일 임병화 성균관대학교 핀테크융합전공 부교수는 여의도에서 개최된 ‘서울 핀테크 위크2024 : 디지털금융 산학협동세미나’에서 ‘핀테크와 인공지능’을 주제로 발표하며 이같이 강조했다.
그는 먼저 AI와 금융이 결합하면서 주목받고 있는 서비스 중 하나로 ‘대안신용평가’를 지목했다. 대안신용평가는 은행이 대출 실행 여부를 평가하는 과정에서 기존 은행권이 활용하는 신용평가 모델과는 다른 방식으로 신용 등급을 책정하는 것을 의미한다. 방대한 데이터를 학습한 AI 모델을 통해 더 넓은 관점에서 신용도를 평가하고, 중저신용자 대출 시장 진입을 돕겠다는 취지다. 국내에서도 핀테크 기업과 은행권이 협업해 다양한 데이터를 대안신용평가 서비스를 속속 도입하고 있는 추세다.
임 교수는 AI 관련 서비스가 쏟아지고 있지만, 관련 데이터가 부재하거나, 지나치게 편중돼 있어 정확한 대안신용평가를 위해서는 다양한 양질 데이터 필요성이 높아지고 있다고 강조했다. 이 문제를 해결하기 위해서는 생성형 AI를 통한 데이터 추출 기법이 연구돼야 한다는 의견도 제시했다.
임 교수는 “신용평가 영역에서 AI를 활용하기 위해서는 균형 잡힌 데이터를 기반으로 한 머신러닝이 충분히 이뤄져야 하지만, 국내 시장에서는 정제된 데이터가 거의 없다”며 “산업 내에서 AI 학습 재료가 될 수 있는 데이터를 새로 생성하는 생성형 AI 기법이 필요하다”고 설명했다.
이어 주식 시장에서 새롭게 떠오르는 AI 투자 기법 로보어드바이저에 대한 신뢰 확보를 위해서도 데이터 품질을 높일 필요가 있다고 제언했다. 로보어드바이저 기반 퇴직연금 시장이 크게 성장하고 있지만, 데이터 품질 저하 문제는 해결될 기미가 보이지 않는다는 우려다.
임 교수는 “데이터의 품질은 RA 투자 결과에 대한 신뢰성으로 이어진다”며 “데이터가 부족하고 데이터 품질이 좋지 않다. 지난 2018년부터 2020년도에 이르기까지 데이터 품질과 관련된 기업 리서치에서도 크게 개선된 부분이 없었다”고 강조했다.
그는 연구를 위한 독자적인 데이터 자원을 확보할 필요가 있다고도 조언했다. 다양한 대학에서 AI 데이터 연구를 진행하고 있지만, 각각 대학이 독자적으로 연구용 데이터를 구축하는 것은 한계가 있기 때문에 정부 차원에서 관련 자원 확보를 위해 지원을 아끼지 말아야 한다는 의견이다.
그는 “데이터 거래소, 연합학습이 대안이 되고 있다”며 “미국은 펀드를 받아서 대학 머신러닝 연구에 필요한 데이터셋 자원을 운영하고 있다. 한국도 이런 점을 참고해야 한다”고 분석했다.
마지막으로 임 교수는 블록체인과 관련해서도 AI 금융 신뢰성 확보를 위해서 필요한 기술이라고 언급했다.
임 교수는 “토큰증권(STO) 등 시장이 활성화 되기 위해서는 블록체인과 같은 기술을 활용해 시장 투명성을 확보할 수 있다”며 “AI가 모든 것을 해결할 수는 없다. 다양한 기술과 AI 기술이 공유 결합되는 시기”라고 강조했다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52