보이스피싱 원본 음성 데이터 왜 못 쓰나 했더니…'범죄자 개인정보'가 걸림돌
개인정보위, 포스트타워서 제2차 '2025 개인정보 미래포럼' 개최
"텍스트는 한계"…국과수, AI 실시간 대응 위해 음성 원본 활용 추진
![[서울=뉴시스]](https://img1.newsis.com/2023/04/07/NISI20230407_0001236476_web.jpg?rnd=20230407085810)
[서울=뉴시스]
[서울=뉴시스]송혜리 기자 = "보이스피싱 범죄가 좀처럼 줄어들지 않고 있습니다. 이 범죄를 선제적으로 막기 위해선 원본 음성 데이터를 활용하는 것이 가장 효과적이지만, 문제는 범죄자의 음성 데이터 활용에 대한 동의를 받을 수 없다는 데 있습니다."
16일 서울 중구 포스트타워에서 열린 개인정보보호위원회 주관 '2025 개인정보 미래포럼' 제2차 회의에서 박남인 국립과학수사연구원 연구관은 보이스피싱 범죄 대응을 위한 인공지능(AI) 시스템 구현 과정에서 마주한 현실적 한계에 대해 이같이 말했다.
박 연구관은 통신사들과 함께 추진 중인 보이스피싱 탐지 AI 서비스의 데이터베이스(DB) 마련을 위해, 피해자의 이름 등 민감한 정보에 대해 비식별 처리를 거쳤다고 강조했다. 하지만 범죄자 음성에 대한 활용은 여전히 난제로 남아 있다는 점을 지적했다.
이날 개인정보 미래포럼은 개인정보 관련 주요 의제를 선제적으로 논의하고, 산업계와 시민사회의 다양한 현장 의견을 수렴하는 정책 토론의 장이다. 이날 행사에는 학계, 법조계, 산업계, 시민사회 등 다양한 분야에서 활동 중인 전문가 40명이 참석했다.
개인정보 전문가 40여명 모여…개인정보 의제 논의
그럼에도 불구하고 보이스피싱 범죄와 피해는 줄어들지 않았다. 실제 보이스피싱으로 인한 피해액은 2022년 1415억원에서 2023년 1965억원으로 35.4%나 증가했다.
이에 국과수는 인공지능(AI)을 활용한 보이스피싱 예방 방안이 필요하다고 판단, 보이스피싱 음성 데이터를 텍스트(문자)로 변환하는 기반 기술을 개발하고 이를 통해 마련한 DB를 통신사 등 관련 기관에 제공키로 했다.
박 연구원은 "통화 내용을 실시간으로 스마트폰에서 음성 인식을 통해 분석하고, 즉각 피해자에게 경고 알림을 주는 것이 가장 효과적인 예방책이라고 판단했다"고 밝혔다.
국과수는 보유 중인 약 2만1000건의 보이스피싱 음성 데이터를 AI 음성인식 기술을 통해 텍스트로 변환했으며, 개인정보 유출을 방지하기 위해 이름 등의 정보는 가명처리했다.
이 DB는 현재 통신 3사 AI 기반 보이스피싱 방지 서비스에서 활용되고 있다. SK텔레콤은 에이닷, KT는 후후, LG유플러스는 익시오에 적용했다.
가령, 보이스피싱 전화가 걸려올 경우 스마트폰에서 대화 내용을 분석해 사용자에게 "00님, 현재 통화는 보이스피싱으로 의심됩니다. 주의하시기 바랍니다. 통화를 중지하려면 확인 버튼을 눌러주세요"라는 식의 경고 메시지를 실시간으로 전달하게 된다.
박 연구원은 "개인정보 보호 문제를 고려해 개인정보를 가명 처리했으며, 개인정보보호위원회의 적극적인 지원 덕분에 국과수가 직접 데이터를 기업에 제공한 최초 사례가 됐다"고 말했다.
국과수 "범죄자 동의 없는 데이터, 활용 한계"
박남인 연구원은 "피해자는 자신의 음성 제공에 동의했지만, 범죄자의 경우 동의 절차가 이뤄지지 않아 음성 원본 활용에 법적 문제가 있다"며 "이 때문에 현재는 텍스트로 변환된 데이터만 통신사에 제공하고 있는 상황"이라고 설명했다.
이러한 제약을 극복하기 위해, 국과수와 통신사들은 정부의 규제샌드박스 제도를 활용하고 있다. 규제샌드박스는 기존 법령으로는 허용 여부가 불분명한 신기술·서비스에 대해 일정 기간 동안 실증을 허용해, 상용화 가능성을 검증할 수 있도록 돕는 제도다.
이를 통해 KT는 지난해 10월부터 보이스피싱 범죄자 음성 활용 실증 사업을 진행 중이며, LG유플러스도 이달 시작할 예정이다. 박 연구원은 "SK텔레콤도 개발이 진행 중이며, 상반기 또는 하반기 중 관련 서비스가 출시될 예정"이라며 "SK텔레콤은 이 기술이 상용화될 경우 연간 약 1500억원의 보이스피싱 피해가 감소할 수 있을 것으로 추산하고 있다"고 설명했다.
박 연구원은 향후 계획에 대해 "이 프로젝트는 일회성으로 그치지 않고, 지속적으로 데이터를 통신사에 제공할 예정"이라며 "각 통신사의 음성인식 엔진을 기반으로 맞춤형 데이터를 제공해 더욱 정교한 탐지 모델을 구축할 계획"이라고 밝혔다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지