음성 복제 소프트웨어 다양한 조작 가능, 이에 실질적인 안정장치 필요
[Industry News 전시현 기자] 최근 사람의 음성을 수 초 내로 복사할 수 있는 능력을 지닌 일명 'Deep Voice'라는 소프트웨어를 개발한 바이두(Baidu)가 생체인증 보안과 관련한 두려움을 야기시킬 수 있다는 주장이 제기됐다.
코센 자료에 따르면 바이두가 개발한 소프트웨어는 이미 30분 가량의 훈련 데이터의 유입을 통해 강연자의 신원을 거의 완벽하게 재현해낼 수 있는 능력을 지닌 것으로 나타났다. 하지만 조사 결과 시간단축은 개발작업이 진행됨에 따라 자연스럽게 따라오는 것으로 드러났다. 음성 복제 소프트웨어는 단순 음성을 복제하는 것에서부터 남성에서 여성, 혹은 영국 발음에서 미국 발음으로의 변경 등 다양한 조작 등이 가능하다.
![음성 복제 소프트웨어는 단순 음성을 복제하는 것부터 영국 발음에서 미국 발음으로의 변경 등 다양한 조작이 가능하다. 이러한 정보가 악의적으로 이용되는 것을 대비, 안전한 솔루션을 개발해야 한다고 전문가들은 강조한다. [사진=pixabay]](/news/photo/201803/21948_12627_1449.jpg)
바이두 관계자는 "음성 복제를 통해 인간과 기기 사이의 상호작용에 있어 개인화에 대한 중대한 어플리케이션들의 사용을 가능하게 만들 수 있을 것으로 기대하고 있다. 그러나 신분 도용에 대한 우려도 있다"라며 조심스러운 입장을 보였다.
음성보안솔루션 제공업체인 엘리 앤디(Aeriandi)의 최고정책관리자인 톰 하우드(Tom Harwood)는 "음성 복제 기술 발전에 대해 기기 인터페이스에서 개인화에 중대한 변화를 일으킬 수 있다"라며 이와 동시에 "범죄자들이 음성인식 보안시스템을 속여 누군가의 목소리로 위장하는데 수 초 밖에 걸리지 않아 심각한 우려가 예상된다"라며 의견을 내놓았다.
코센 관계자는 "일례로 전화번호가 합법적으로 사용되고 있는지 혹은 이전에 신용사기 용도로 사용되어 있는지 등에 대한 정보에 대한 분석을 통해 전화를 통한 신용사기 공격이 해외로부터 다수 발생되고 있음을 감안해 볼 때 음성신용사기 기술이 국내외적인 위협을 대비할 수 있는 효과적인 솔루션으로 대두되고 있다"라고 전했다.
이어 "이제 기업들이 신기술을 구현하는 것에 대해 조금 더 심도있는 고민이 필요할 것으로 예상된다. 음성 사기 탐지기술이 사용자의 음성 복제보다 훨씬 더 많은 부수적인 효과를 불러올 수 있는 만큼, 이러한 정보들이 악의적으로 사용될 경우를 대비해 실질적인 안전장치를 마련해야 하는 노력이 필요하다"라고 덧붙였다.