서강대 박형민 교수팀, 최우수 AI 학회 'ICML 2026' 논문 채택
전자공학과 연구진, 7월 서울 코엑스서 발표
임의의 입출력 주파수 대응하는 유연한 음성 복원 모델 제안
![[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 전자공학과 박형민 교수, 신의협 박사, 고재현 박사과정, 정우철 석사과정. (사진=서강대 제공) 2026.05.08. photo@newsis.com *재판매 및 DB 금지](https://img1.newsis.com/2026/05/08/NISI20260508_0002130601_web.jpg?rnd=20260508144546)
[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 전자공학과 박형민 교수, 신의협 박사, 고재현 박사과정, 정우철 석사과정. (사진=서강대 제공) 2026.05.08. [email protected] *재판매 및 DB 금지
신의협 박사가 주도한 이번 연구에는 고재현 박사과정과 정우철 석사과정이 함께 참여했다. 발표 논문 제목은 '음성 복원을 위한 입력-출력 비율 분리를 적용한 쿼리 기반 비대칭 모델링(Query-Based Asymmetric Modeling with Decoupled Input-Output Rates for Speech Restoration)'이다.
연구진은 열악한 환경에서 녹음된 다양한 샘플링 주파수의 입력 음성을 효과적으로 복원할 수 있는 새로운 딥러닝 네트워크 구조를 제안했다.
음성 복원(Speech Restoration)은 잡음·반향·대역 제한·디지털 왜곡 등으로 인해 품질이 저하된 음성을 사람이 듣기에 깨끗하고 자연스럽게 복원하는 기술이다. 기존 연구들은 대부분 고정된 입출력 샘플링 주파수를 가정해 모델을 설계해 왔다는 한계가 있었다.
연구진은 임의의 입력 샘플링 주파수를 가진 음성을 처리하면서도, 사용자가 원하는 임의의 출력 샘플링 주파수로 복원할 수 있는 유연한 음성 복원 모델을 설계했다.
이를 위해 입력 음성의 대역 정보를 분석하는 인코더와 출력 음성을 복원하는 디코더의 역할을 분리한 '입력 대역 분석 인코더–출력 대역 복원 디코더' 기반의 비대칭 네트워크 구조를 제안했다.
한편 'ICML'은 AI 및 기계학습 분야의 발전을 다루는 최상위 국제 학회 중 하나로, 매년 전 세계 학계와 산업계의 연구자, 기업 관계자들이 참여해 최신 연구 성과와 혁신 기술을 발표하고 논의하는 자리이다. 'ICML 2026'은 오는 7월 6일부터 11일까지 서울 코엑스에서 개최될 예정이다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지





























