서강대 연구진, 개발 이미지 분할 기술 'ICLR 2026' 논문 채택

등록 2026.02.11 10:39:42

'지시어 기반 이미지 분할(RIS)' 기술의 새로운 프레임워크 제시

윈도우 단위로 분할…모호한 텍스트 설명에도 타겟 정밀 추출 성공

[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 강석주 교수, 문승훈 석박통합과정, 이해욱 석사, 유현우 석박통합과정. (사진=서강대 제공) 2026.02.11. photo@newsis.com *재판매 및 DB 금지

[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 강석주 교수, 문승훈 석박통합과정, 이해욱 석사, 유현우 석박통합과정. (사진=서강대 제공) 2026.02.11. [email protected] *재판매 및 DB 금지

[서울=뉴시스]박시은 인턴 기자 = 서강대학교는 전자공학과 강석주 교수 연구팀이 이미지 분할 기술 프레임워크 연구를 통해 세계 최고 권위의 인공지능(AI) 학회인 'ICLR 2026'에 채택됐다고 11일 밝혔다.

ICLR(국제표현학습학회)은 연구자의 역량과 영향력을 나타내는 지표인 h-인덱스(index) 기준, 인공지능 분야 글로벌 최상위권에 위치한 국제 학술대회다.

이번에 채택된 논문은 'WIMFRIS: 윈도우 맘바와 저전력·고효율 튜닝 기술이 결합된 차세대 이미지 인식 분할 모델(WIndow Mamba Fusion and Parameter Efficient Tuning for Referring Image Segmentation)'이다.

이는 텍스트 설명을 기반으로 이미지 내 특정 객체를 픽셀 단위로 정확히 찾아내는 '지시어 기반 이미지 분할(RIS)' 기술의 새로운 프레임워크를 제안한 것이다.

연구진은 기존의 파라미터 효율적 튜닝(PET) 방법들이 단순히 층별(layer-wise) 특징 정렬에만 집중해 시각 정보와 언어 정보를 융합하는 '넥(Neck)' 모듈을 간과한 점을 지적했다. 이로 인해 발생하는 성능 병목 현상을 해결하고자 강력한 넥 구조와 효율적인 튜닝 전략을 결합한 기술 'WIMFRIS'를 개발했다.

이번 연구의 핵심은 '계층적 맘바 퓨전(HMF)' 블록과 이를 구성하는 '윈도우 맘바 퓨저(WMF)' 모듈이다. 기존의 상태 공간 모델(SSM)인 맘바(Mamba)는 긴 시퀀스를 처리할 때 정보가 소실되는 문제가 있었으나, 연구진은 이미지를 겹치지 않는 윈도우 단위로 분할함으로써 이를 해결했다.

[서울=뉴시스] 기존 방법론과 제안 방법론에 대한 'WIMFRIS' 정성적 비교 결과. (사진=서강대 제공) 2026.02.11. photo@newsis.com *재판매 및 DB 금지

[서울=뉴시스] 기존 방법론과 제안 방법론에 대한 'WIMFRIS' 정성적 비교 결과. (사진=서강대 제공) 2026.02.11. [email protected] *재판매 및 DB 금지

특히 해당 기술은 복잡한 배경이나 모호한 텍스트 설명이 주어진 상황에서도 타겟을 분할해낼 수 있어, 인간과 로봇의 상호작용(HRI)·자율주행·지능형 이미지 편집 등 다양한 산업 분야의 원천 기술로 활용될 것으로 기대된다.

강 교수는 "WIMFRIS는 기존 경량화 튜닝 기법들이 놓치고 있던 중간 단계의 정보 융합 중요성을 입증하고, 차세대 딥러닝 모델인 맘바(Mamba)를 비전-언어 태스크에 최적화해 적용한 사례"라고 말했다.

한편 문승훈·유현우 석박통합과정생과 이해욱 석사가 참여한 이번 연구는 과기정통부의 재원으로 정보통신기획평가원·한국연구재단의 지원, 정보통신기획평가원-대학ICT연구센터(ITRC)의 지원을 받아 수행됐다.

◎공감언론 뉴시스 [email protected]