"한국어 AI 데이터 0.6% 불과…데이터 주권까지 흔들린다"

등록 2025.12.11 14:11:56

AI미래가치 포럼 '글로벌 AI안전생태계 주권 확보를 위한 정책토론회'

김영주 AI연구소장 "AI 석학도 AI 안전 강조…AI 안전 확보 노력해야"

"한국어 데이터 턱없이 부족, AI 안전에 약해…韓 AI 거버넌스 필요"

[서울=뉴시스] 국회 박정, 이인선, 강승규, 김형동, 이정헌 의원이 공동 주최하고 AI 미래가치 포럼이 주관한 '글로벌 AI안전생태계 주권 확보를 위한 정책토론회'가 열렸다.

*재판매 및 DB 금지

[서울=뉴시스] 심지혜 기자 = "인류는 인공지능(AI)을 활용해 역사상 가장 큰 혜택을 누릴 것이지만 AI로 인한 부작용과 역기능을 처리하기 위해 받은 혜택의 2배를 쏟아부어야 할 것이다." -제프리 힌튼 토론토대 교수

"AI로 잡포칼립스(일자리 대재앙)에 대한 걱정보다 더 심각한 것은 강력한 AI 시스템에 대한 악의적 사용자의 접근(악용)을 제한하는 것이다." -데미스 하사비스 구글 딥마인드 최고경영자

11일 국회에서 열린 '글로벌 AI안전생태계 주권 확보를 위한 정책토론회'에서 AI 안전연구소 김명주 소장은 노벨상 수상자들의 경고를 인용해 AI 안전 시급성을 강조했다.

김 소장은 “AI 발전하고 있지만 발전 속도만큼 편향이나 위험들에 대한 논의가 상대적으로 적은 게 문제”라며 “결국 안전·신뢰가 확보되지 않는 상황에서 AI 산업 발전은 국가 경쟁력 측면에서 문제가 된다. 산업 성장의 발목을 잡는다”고 말했다.

이어 "AI는 활 시위를 떠난 화살과 같은 상황으로 글로벌 국가들의 선점 경쟁이 치열하게 벌어지고 있지만, 동시에 AI 안전에 대한 걱정도 공존한다"며 "가장 안전하고 신뢰있는 생태계를 만들기 위해 국가단위로 안전 연구소를 만들어서 움직여야 한다는 목소리가 나오고 있다"고 설명했다.

그는 "우리나라는 일찍이 AI 안전 논의에 적극 참여해 왔고, 여섯 번째로 AI 안전 연구소를 설립했다"고 덧붙였다.

"턱없이 부족한 한국어 데이터…AI 안전에 취약"

김 소장은 특히 한국어 데이터 부족한 상황을 구조적 위험으로 규정했다. 그는 "영어 기반 AI는 안전하게 작동하지만 한국어 질문에서는 위험이 더 크다"며 "학습 기반이 압도적으로 부족해 안전 격차가 벌어질 수밖에 없다”고 말했다.

글로벌 1000만개 웹사이트 분석 기준으로 영어는 약 50%, 일본어 5.1%, 중국어 1.1%인데 한국어는 0.6% 수준에 그친다.

김 소장은 특히 일반인이 AI를 활용해 CBRN(화학·생물·방사선·핵) 정보를 추출하는 위험을 비롯해 공론 조작 등 AI 위험에 대응하기 위한 한국형 안전 데이터셋 구축을 시급한 국가 과제로 제시했다.

W3Techs가 조사한 1000만개 웹사이트에 대한 콘텐츠 언어 사용 통계치에 따르면 영어가 약 50%로 가장 많았고 일본어 5.1%(4위), 중국어 1.1%(12위)인 반면 한국어는 0.8%로 17위 수준에 그친다.

김 소장은 "한국어 웹 콘텐츠가 0.6%에 불과한 현실은 데이터 주권 위기로 볼 수 있다"며 "영어로 질문하면 대답을 잘하지만 한국어로 질문하면 안전에서 더 위험하다. 학습이 부족하다”라고 말했다.

이에 AI안전연구소는 '한국형 AI 위험 지도'를 제작, 대응해 나간다는 방침이다. 또 정부가 추진 중인 독자파운데이션모델에 대해서도 안전, 신뢰 평가도 진행한다.

이와 함께 'AI 안전 보고서'를 발행, AI 관련 안전 체크리스트도 준비하고 있다. AI안전에 관해 국민이나 기업들이 불안해 하는 부분이 있어 확인할 수 있도록 하겠다는 취지다.

특히 AI 안전이 우리나라가 목표로 하는 AI 3대 강국의 경쟁력 확보에서 핵심 요소가 될 것이라는 점을 강조했다.

김 소장은 “앞서가는 미국과 중국을 따라잡는 것은 현실적으로 불가능하지만, '한국의 AI 기업은 안전에 관해서는 확실하다'는 인식을 줄 수 있어야 한다"며 "G3로의 도약에 있어 AI 안전이 경쟁력이 될 수 있다"고 강조했다.

"한국형 AI 안전 거버넌스 필요"…정부, 'AI 안전 종합계획' 준비

이어진 토론에서는 절차중심 규제의 한계, 윤리·안전·표준의 통합 필요성, 규범 주권 확보, 고품질 데이터셋의 국가적 중요성 등 다양한 측면에서 한국형 AI 안전 거버넌스 구축의 방향성이 제시됐다. 국회, 정부의 정책지원이 필요하다는 목소리도 나왔다.

문정욱 정보통신정책연구원(KISDI) 실장은 진정한 AI 경쟁력은 윤리, 안전, 표준이 결합될 때 비로소 완성된다고 강조하고, 한국이 개발한 전문가·시민 참여 기반의 윤리영향평가 모델을 국제사회에 프로세스 표준으로 제안하고, 국가 간 영향평가 상호 인정 체계를 구축하는 등 국제협력 기반을 마련해야 한다고 주장하였다.

안정민 한림대 교수는 현행 AI 규제가 유럽연합의 'AI 액트'처럼 절차 중심의 컴플라이언스 모델에 편중되어 있어 실제 위험감소 효과가 불확실하다고 지적했다. 기업의 행정 부담만 커지는 구조라 성능·공정성·신뢰성 기반의 정량적 안전 기준이 필요하다고 주장했다.

민대기 이화여대 교수는 AI 안전이 규제가 아니라 지속가능한 혁신과 글로벌 시장 진입의 핵심기반이라고 강조하고 국제표준에 부합하는 안전 관리 체계와 더불어, 우리 산업 특성에 맞는 한국형 AI 안전 평가체계 구축이 필요하다고 제언하였다.

황정현 법무법인 세종 변호사는 AI 위험은 초국경적으로 확산되므로 국가 단독 규제로는 한계가 있다고 짚었다. 국제 협력 기반의 거버넌스가 필수이며, 규범 종속을 피하려면 자체적 AI 안전성 평가·데이터 거버넌스·국제 표준 주도권 확보가 국가전략으로 필요하다고 언급했다.

김진기 항공대 교수는 AI 결과의 부정확성은 시장경쟁을 통해 조정될 수 있지만 악의적 이용은 기술·운영·인적 개입을 포함한 지속적 대응 체계가 필요하다고 촉구했다.

특히 한국은 경쟁력 있는 AI 생태계 조성을 위해 고품질 한국어 학습데이터셋 구축을 국가 차원의 R&D로 인식하고 정부가 적극 지원해야 한다고 강조했다.

이성엽 AI미래가치포럼 의장은 "AI 확산으로 오용·편향·환각 위험이 커지는 상황에서 AI 안전 확보가 산업 성장의 전제 조건"이라며 "AI 안전 생태계 주권을 어떻게 실질적으로 확보해 나갈지 논의하는 것이 핵심 과제"라고 말했다.

김국현 과기정통부 과장은 "환각, 편향성, 기술 오용, 사이버 해킹, 가짜뉴스 등 AI가 통제를 상실하는 다양한 위험이 우려된다"며 "세계 여러 나라가 대응 중이고 정부도 AI 안전 노력을 기울이고 있다"고 말했다.

이어 "AI 기본법이 내년 1월 공포된다. 혁신·안전·신뢰 균형에 맞춘 세계 두 번째 법으로, 국내 IT 생태계 특성에 맞게 산업 혁신과 안전·신뢰가 균형을 이룰 수 있도록 지원하는 데 중점을 뒀다"며 "AI 안전 종합계획을 준비 중이며 산업 혁신 지원에도 초점을 맞추고 있다"고 부연했다.

◎공감언론 뉴시스 [email protected]