서강대 최준석 교수팀, AI 학술대회 'ICLR 2026' 논문 채택
이미지 간 경계 명확히 세워 AI 오류 줄이는 기법 제시
멀티 이미지·문서 기반 시스템 신뢰성·정확도 향상 핵심 기술
![[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 컴퓨터공학과 최준석 교수, 이민영 박사과정, 박예지 석박통합과정, 김예진 석사과정, 황동준 박사과정. (사진=서강대 제공) 2026.02.20. photo@newsis.com *재판매 및 DB 금지](https://img1.newsis.com/2026/02/20/NISI20260220_0002066493_web.jpg?rnd=20260220102255)
[서울=뉴시스] (왼쪽 위부터 시계방향) 서강대 컴퓨터공학과 최준석 교수, 이민영 박사과정, 박예지 석박통합과정, 김예진 석사과정, 황동준 박사과정. (사진=서강대 제공) 2026.02.20. [email protected] *재판매 및 DB 금지
이번에 연구팀의 논문이 채택된 'ICLR(국제학습표현학회)'은 인공지능(AI)·머신러닝 분야에서 세계적으로 권위 있는 국제 학술대회로, 오는 4월 23일부터 27일까지 브라질에서 개최될 예정이다.
LVLM은 단일 이미지 기반 과제에서는 우수한 성능을 보이지만 여러 이미지를 동시에 입력받는 경우, 정보가 혼합되는 교차 이미지 정보 유출(cross-image information leakage) 문제로 인해 추론 성능이 대폭 저하되는 한계가 있다.
기존 모델들은 이미지 구분을 위해 딜리미터(delimiter) 토큰을 사용하고 있으나, 연구진의 분석 결과 이러한 토큰들이 실제로는 이미지 간 정보 유출을 효과적으로 차단하지 못하는 것이 확인됐다.
이에 연구진은 딜리미터 토큰의 은닉 상태(hidden state)를 스케일링하는 기법을 제안했다. 해당 방법은 이미지 내부 토큰 간 상호작용(intra-image interaction)을 강화하는 동시에, 서로 다른 이미지 간의 불필요한 상호작용을 억제함으로써 모델이 이미지별 정보를 보다 명확히 구분하고 정확한 다중 이미지 추론을 수행할 수 있도록 한다.
![[서울=뉴시스] 연구 개념도. (사진=서강대 제공) 2026.02.20. photo@newsis.com *재판매 및 DB 금지](https://img1.newsis.com/2026/02/20/NISI20260220_0002066494_web.jpg?rnd=20260220102343)
[서울=뉴시스] 연구 개념도. (사진=서강대 제공) 2026.02.20. [email protected] *재판매 및 DB 금지
한편 '다중 이미지 인식을 위한 딜리미터 토큰 스케일링 기법 연구(Enhancing Multi-Image Understanding through Delimiter Token Scaling)'라는 제목으로 발표된 이번 논문에는 서강대 이민영 박사과정, 박예지 석박통합과정, 김예진 석사과정, 황동준 박사과정이 함께 이름을 올렸다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지





























