'독자AI' 기준 뭐길래…네이버로 번진 기술 표절 논란

등록 2026.01.07 06:00:00수정 2026.01.07 07:16:23

업스테이지에 네이버클라우드까지 '독자 AI' 논란

업계, '독자 AI' 기준 불명확해 혼란 가중

정부 "파생형 AI 모델은 안돼…심사 항목에 독창성 포함"

[서울=뉴시스] 이영환 기자 = 배경훈(왼쪽 다섯 번째부터) 부총리 겸 과학기술정보통신부 장관, 하정우 청와대 AI미래기획수석 등이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에 참석해 기념촬영을 하고 있다. 2025.12.30. 20hwan@newsis.com

[서울=뉴시스] 이영환 기자 = 배경훈(왼쪽 다섯 번째부터) 부총리 겸 과학기술정보통신부 장관, 하정우 청와대 AI미래기획수석 등이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에 참석해 기념촬영을 하고 있다. 2025.12.30. [email protected]

[서울=뉴시스]오동현 윤정민 심지혜 기자 = 정부가 주관한 '독자 인공지능(AI) 파운데이션 모델' 프로젝트 참여 기업이 잇따라 표절 논란에 휘말리고 있다. 최근 업스테이지에 이어 네이버클라우드까지 중국계 AI 모델을 참고했다는 의혹이 제기되며 '독자 AI' 기준을 둘러싼 논쟁이 커지고 있다.

7일 업계에 따르면 네이버클라우드가 개발한 '하이퍼클로바X 시드 32B 싱크' 모델이 중국 알리바바의 큐웬(Qwen) 2.4 모델과의 비교에서 비전 인코더 웨이트(가중치) 코사인 유사도, 피어슨 상관계수가 높다는 주장이 나왔다.

지난 1일에는 업스테이지가 공개한 AI 모델 '솔라 오픈 100B'가 중국 지푸AI 'GLM-4.5-에어' 모델을 복사해 미세조정했다는 의혹이 불거져 논란이 됐다.

두 회사 모두 데이터 수집부터 모델 설계, 학습까지 전 과정을 자체 수행하는 '프롬 스크래치(From Scratch)' 방식으로 독자 AI 모델을 개발했다고 주장했다. 하지만 업계에서는 '독자 AI' 정의를 두고 의견이 분분한 상황이다.

네이버 "전략적 선택…독창성은 통합 아키텍처"

[서울=뉴시스] 이영환 기자 = 하정우 청와대 AI미래기획수석이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에서 네이버클라우드 부스를 살펴보고 있다. 2025.12.30. 20hwan@newsis.com

[서울=뉴시스] 이영환 기자 = 하정우 청와대 AI미래기획수석이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에서 네이버클라우드 부스를 살펴보고 있다. 2025.12.30. [email protected]

네이버 측은 외부 인코더 사용에 대해 기술력 부족이 아닌 전략적 선택이었다고 강조했다.

네이버는 "파운데이션 모델은 입력된 정보를 해석하고 추론하며 결과를 만들어내는 핵심 영역으로 인간으로 치면 사고와 정체성을 담당하는 '두뇌'에 해당한다"며 "이 핵심 엔진을 프롬 스크래치 단계부터 100% 자체 기술로 개발해 한국어와 한국 사회의 복잡한 맥락을 가장 깊이 이해하는 독자적인 경쟁력을 확보했다"고 밝혔다.

외부 비전 인코더 사용에 대해서는 "네이버도 VUClip 등 독자적인 비전 기술력을 충분히 보유하고 있다"면서도 "이번 모델에서는 글로벌 기술 생태계와의 호환성, 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"고 설명했다.

네이버는 "기술적 자립도가 부족해서가 아니라, 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단"이라며 "글로벌 AI 업계에서도 이러한 방식은 시스템 확장성을 위한 보편적인 설계 표준으로 자리 잡고 있다"고 강조했다.

실제로 알리바바의 큐웬2-오디오는 오픈AI 음성인식 기술(위스퍼)을, 큐웬3-옴니는 구글의 이미지 인식 기술(시그립2·SigLIP2)을 기반으로 구축했다는 게 네이버 측 설명이다.

네이버는 "이번 모델의 핵심 기여는 단순 부품의 조립이 아닌, 통합 아키텍처의 완성에 있다"며 "텍스트, 음성, 이미지를 하나의 유기적인 구조 안에서 동시에 이해하고 생성하도록 설계하는 것이 멀티모달 AI의 가장 본질적이고 어려운 과제"라고 말했다.

이어 "기술적 선택 사항과 라이선스 정보를 허깅페이스와 테크 리포트를 통해 투명하게 공개해 왔다"며 "모델 성능을 속이거나 기술적 기여를 과장하려는 의도는 전혀 없다"고 덧붙였다.

업계, 독자AI 기준 놓고 의견 분분

[서울=뉴시스] 이영환 기자 = 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에서 네이버클라우드 부스를 찾은 시민이 AI 아바타 체험을 하고 있다. 2025.12.30. 20hwan@newsis.com

[서울=뉴시스] 이영환 기자 = 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에서 네이버클라우드 부스를 찾은 시민이 AI 아바타 체험을 하고 있다. 2025.12.30. [email protected]

일각에선 네이버가 프로젝트에 제출한 모델이 비전과 음성 인코더 부분에서 "중국 큐웬 모델 가중치를 그대로 사용한 것 아니냐"며 진정한 '프롬 스크래치'로 볼 수 없다고 지적한다.

한 업계 고위 관계자는 "프롬 스크래치는 가중치를 '0(제로)'이나 '랜덤' 상태에서 시작해야 한다. 네이버의 옴니 모델은 비전·보이스 파트에서 중국 큐웬의 가중치를 100% 그대로 가져다 쓴 것으로 파악된다"며 "'두뇌(대규모언어모델·LLM)는 우리 것이니 괜찮다'는 네이버의 주장은 설득력이 부족하다"고 말했다.

이 관계자는 또 "비전이나 보이스 인코더 역시 모델의 유기적인 '지능'의 일부"라며 "일부라도 외부 가중치를 썼다면 기준을 어긴 것"이라고 주장했다.

네이버는 이에 대해 "인코더를 그대로 고정해 사용한 것은 아니고 상당한 수준의 최적화와 추가 학습을 거쳤다"고 반박했다.

반면 이러한 논란이 과도하다는 입장도 있다. 한 AI 스타트업 관계자는 "프롬 스크래치의 핵심은 모델을 랜덤 상태에서 시작해 사전 학습을 시켰느냐가 핵심"이라며 "비전 인코더는 시각 정보를 변환하는 부품 중 하나일 뿐"이라고 설명했다.

이어 "국산 요리를 만드는데 외국산 '후추'를 썼다고 해서 국산 요리가 아니라고 할 수 없는 것과 같다"며 "인코더를 일부 차용했다고 해서 모델 전체에 대한 제어권이나 통제권을 잃는 것이 아니므로, 이를 근거로 '프롬 스크래치'가 아니라고 주장하는 것은 과도하다"고 반박했다.

정부 평가 기준 불명확…혼란 가중

[서울=뉴시스] 업스테이지는 2일 서울 강남구 한국과학기술회관에서 업계 관계자들을 초청해 '독자 AI 파운데이션 모델' 프로젝트를 통해 개발한 '솔라 오픈 100B' 공개 검증을 진행했다. 2025.01.04. (사진=업스테이지 제공) *재판매 및 DB 금지

이번 논란의 중심에 서 있는 '프롬 스크래치'라는 표현은 정작 글로벌 AI 학계·업계에서는 통용되지 않는, 사실상 한국에서만 독특하게 강조되는 용어다.

과거 국내 스타트업들이 주로 해외 모델을 가져와 '미세조정'만 하던 관행을 네이버가 차별화하기 위해 2021년 '하이퍼클로바' 공개 당시 용어가 대중화됐다는 게 업계 설명이다.

하지만 이 용어가 국산 AI의 '기술적 자립도'를 판가름하는 절대적 기준으로 격상되면서 오히려 기술적 실리와 정책적 명분 사이의 혼란을 키우고 있다는 분석이 나온다.

이 가운데 정부도 독자 AI 모델의 독자성을 판단하는 명확한 기준을 제시하지 않아 혼란이 가중되고 있다.

과기정통부가 지난해 7월 발표한 독자 AI 파운데이션 모델 프로젝트 공모 안내서에는 "해외 AI 모델의 파인튜닝(미세조정) 등을 통한 파생형 AI 모델 개발은 본 사업의 독자 AI 파운데이션 모델 개발로 간주되지 않는다"고 명시돼 있을 뿐이다.

한 업계 관계자는 "프롬 스크래치의 정의, 기여의 기준, 투명한 공개 관행 등에 대한 학술적, 제도적 논의가 필요하다"고 말했다.

또 다른 관계자도 "'파운데이션 모델' 같이 전략적으로 독자 개발해야 하는 영역과 편향이나 최신성 이슈 등으로 재학습의 필요가 없는 인코더 영역은 구분돼야 한다고 본다"며 "프롬 스크래치의 범위가 어디까지인지, 프롬 스크래치 논의 목적이 무엇인지는 정부와 업계 논의가 필요할 것"이라고 밝혔다.

앞서 업스테이지의 독자 AI 모델에 의문을 제기했다가 철회한 고석현 사이오닉AI 대표도 "독자 모델의 정의, 기여의 기준, 투명한 공개 관행 등 학술적, 제도적 논의를 성숙시키는 계기가 되길 바란다"고 제언했다.

과학기술정보통신부 관계자는 "현재 평가기간 중으로 심사위원들이 평가 항목에 맞춰 들여다볼 것"이라며 "심사 항목에도 독창성이 있다. 일단 이달 15일까지 평가기간이며, 평가 결과는 최대한 빠르게 정리해서 발표할 것"이라고 밝혔다.

◎공감언론 뉴시스 [email protected], [email protected], [email protected]