서강대 연구진, 개발 이미지 분할 기술 'ICLR 2026' 논문 채택
'지시어 기반 이미지 분할(RIS)' 기술의 새로운 프레임워크 제시
윈도우 단위로 분할…모호한 텍스트 설명에도 타겟 정밀 추출 성공
![[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 강석주 교수, 문승훈 석박통합과정, 이해욱 석사, 유현우 석박통합과정. (사진=서강대 제공) 2026.02.11. photo@newsis.com *재판매 및 DB 금지](https://img1.newsis.com/2026/02/11/NISI20260211_0002061136_web.jpg?rnd=20260211102304)
[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 강석주 교수, 문승훈 석박통합과정, 이해욱 석사, 유현우 석박통합과정. (사진=서강대 제공) 2026.02.11. [email protected] *재판매 및 DB 금지
ICLR(국제표현학습학회)은 연구자의 역량과 영향력을 나타내는 지표인 h-인덱스(index) 기준, 인공지능 분야 글로벌 최상위권에 위치한 국제 학술대회다.
이번에 채택된 논문은 'WIMFRIS: 윈도우 맘바와 저전력·고효율 튜닝 기술이 결합된 차세대 이미지 인식 분할 모델(WIndow Mamba Fusion and Parameter Efficient Tuning for Referring Image Segmentation)'이다.
이는 텍스트 설명을 기반으로 이미지 내 특정 객체를 픽셀 단위로 정확히 찾아내는 '지시어 기반 이미지 분할(RIS)' 기술의 새로운 프레임워크를 제안한 것이다.
연구진은 기존의 파라미터 효율적 튜닝(PET) 방법들이 단순히 층별(layer-wise) 특징 정렬에만 집중해 시각 정보와 언어 정보를 융합하는 '넥(Neck)' 모듈을 간과한 점을 지적했다. 이로 인해 발생하는 성능 병목 현상을 해결하고자 강력한 넥 구조와 효율적인 튜닝 전략을 결합한 기술 'WIMFRIS'를 개발했다.
이번 연구의 핵심은 '계층적 맘바 퓨전(HMF)' 블록과 이를 구성하는 '윈도우 맘바 퓨저(WMF)' 모듈이다. 기존의 상태 공간 모델(SSM)인 맘바(Mamba)는 긴 시퀀스를 처리할 때 정보가 소실되는 문제가 있었으나, 연구진은 이미지를 겹치지 않는 윈도우 단위로 분할함으로써 이를 해결했다.
![[서울=뉴시스] 기존 방법론과 제안 방법론에 대한 'WIMFRIS' 정성적 비교 결과. (사진=서강대 제공) 2026.02.11. photo@newsis.com *재판매 및 DB 금지](https://img1.newsis.com/2026/02/11/NISI20260211_0002061144_web.jpg?rnd=20260211102621)
[서울=뉴시스] 기존 방법론과 제안 방법론에 대한 'WIMFRIS' 정성적 비교 결과. (사진=서강대 제공) 2026.02.11. [email protected] *재판매 및 DB 금지
강 교수는 "WIMFRIS는 기존 경량화 튜닝 기법들이 놓치고 있던 중간 단계의 정보 융합 중요성을 입증하고, 차세대 딥러닝 모델인 맘바(Mamba)를 비전-언어 태스크에 최적화해 적용한 사례"라고 말했다.
한편 문승훈·유현우 석박통합과정생과 이해욱 석사가 참여한 이번 연구는 과기정통부의 재원으로 정보통신기획평가원·한국연구재단의 지원, 정보통신기획평가원-대학ICT연구센터(ITRC)의 지원을 받아 수행됐다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지





























