“韓, 글로벌과 기술격차 적어…합성데이터 사례부터 만들 때”
[디지털데일리 최민지기자] “합성데이터는 선진국과 기술격차가 크지 않은 초기 단계에 있다. 국내 합성데이터에 필요한 건, 많은 레퍼런스를 만드는 것이다.”
임종호 연세대 응용통계학과‧통계데이터사이언스학과 교수는 30일 국립중앙도서관에서 ‘데이터 경제시대의 핵심기술, 합성데이터 안전 활용 방안’ 주제로 열린 2024년도 제1회 ‘개인정보 기술포럼’에서 이 같이 밝혔다.
전세계 인공지능(AI) 일상화가 시작되면서, AI 학습에 필요한 대규모 데이터 가치는 더욱 커졌다. 개인정보와 프라이버시를 보호하는 동시에 데이터를 다량으로 확보하는 방안으로 ‘합성데이터’가 주목되고 있다. 합성데이터는 실제 데이터와 통계적 특성이 유사해, 실제 데이터 분석 결과와 유사한 결과를 얻을 수 있도록 새롭게 생성한 가상의 데이터다.
아직 합성데이터는 초기 단계인 만큼, 극복해야 할 과제들이 있다. 다시 말해, 한국이 합성데이터 기술을 주도할 기회가 있다는 뜻이다. 우선, 합성데이터 사례들을 많이 만드는 것이 필요하다는 설명이다.
임종호 교수는 “글로벌 리딩 기업들과 비교해도 한국과 기술력 차이가 크지 않다. 세밀한 영역으로 가면, 아직 엉성한 부분이 있고, 우리가 따라갈 수 있는 부분도 있다”며 “아직은 경험이 많지 않아 얼마나 안전한지 알 수 없어, 많은 도메인 레퍼런스를 만들어봐야 한다”고 말했다.
임 교수는 합성데이터 사례가 필요한 영역을 ▲의‧약학 ▲에너지‧기후 ▲금융분야를 꼽았다. 합성 데이터 자체만으로 가치가 있고, 이전에는 없었던 가치와 부가 서비스를 만들 수 있기 때문이다.
이날 합성데이터를 쉽게 익명처리될 수 있도록 절차적 확립이 필요하다는 주장도 제기됐다. 합성데이터가 익명데이터와 비슷하게 대우돼야, 법적 리스크를 줄일 수 있다는 것이다.
김도엽 김앤장법률사무소 변호사는 “합성데이터는 편향성을 감소시키고 개인정보 이슈를 사전에 차단하는 점에서 큰 가치가 있다”며 “합성데이터가 쉽게 익명 처리될 수 있도록 프로세스와 프랙틱스를 확립해야 한다. 초반에는 제한된 환경에서 적정성 평가를 통해 익명 정보임을 확인하고 반출한 후, 추후엔 쉽게 합성데이터를 사용할 수 있도록 하는 방안도 고려할 수 있다”고 제안했다.
심동욱 한국인터넷진흥원(KISA) 단장은 합성데이터가 ‘무조건 익명’이라는 불필요한 오해를 줄이기 위해 어느 수준의 합성데이터인지 표시를 해야 한다는 의견을 개진하기도 했다.
이에 개인정보보호위원회(이하 개인정보위)는 학계‧산업계과 연구반을 구성해 현재 합성데이터 관련 가이드라인을 만들고 있다고 밝혔다. 가이드라인을 통해 합성데이터로 판단할 수 있는 근거과, 법으로 보호받을 수 있는 근거를 만들겠다는 것이다.
고낙준 개인정보보보호위원회 신기술개인정보과장은 “AI 핵심은 안정성이다. 비정형 데이터 가명처리 방안을 발표했고, 공개된 정보를 AI에 어떻게 활용할 지에 대해서도 방안을 마련하고 있는데, 이 중 하나가 합성데이터”라며 “문제가 있는 데이터는 걸러내야 하지만, 다 걸러낸다면 쓸 재료가 없게 된다. 비정형, 가명처리 등 다양한 방식을 통해 개인정보 침해 요소를 줄이고자 한다”고 설명했다. 이어 “합성데이터는 결국 익명정보가 돼야 한다”며 “익명성 판단을 중점적으로 살펴보고 있다”고 부연했다.
한편, 이날 염흥열 개인정보기술포럼 의장은 “합성데이터는 중요한 개인정보 프라이버시 기술로, 정보주체 동의를 받을 때 문제될 수 있는 부분을 원천적으로 해결할 수 있는 중요한 기술”이라며 “개인정보 기술포럼은 민‧관 싱크탱크로, 산학연 공동 연구를 통해 기술 표준 분야의 전문 지식을 공유하고 논의하는 자리를 지속적으로 마련하겠다”고 전했다.
[오징어게임2 이펙트] "Are you Squid Game?"…글로벌 문화 축제로
2024-12-26 15:40:17신한은행, 배리어프리 키오스트 도입 확대 …"장애인·고령자용 키오스크 지원"
2024-12-26 14:48:58카카오페이, 송금 최다 기록한 날은?… 연말결산 데이터 공개
2024-12-26 14:48:23알뜰폰 시장점유율 제한법, 과방위 소위 병합 통과…"대기업·금융권 포함 60%"
2024-12-26 14:48:15