newsis

플리토, 국립국어원 '한국어-외국어 말뭉치 구축 사업' 수주

등록 2026.04.13 09:07:35

595만 어절 규모 말뭉치 구축

동남아 저자원 언어 데이터 부족 해소

플리토, 국립국어원 '한국어-외국어 말뭉치 구축 사업' 수주

[서울=뉴시스]오동현 기자 = 인공지능(AI) 데이터 및 솔루션 전문 기업 플리토가 국립국어원이 주관하는 ‘2026년 한국어-외국어 말뭉치 구축 사업’의 수행 기업으로서 사업 수주에 성공했다고 13일 밝혔다.

‘한국어-외국어 말뭉치 구축 사업’은 AI 시대에 한국어 중심의 언어 데이터 주권을 확보하고, 통번역 및 음성인식 등 AI 언어 기술 개발을 지원하기 위해 추진되는 국립국어원의 대표적인 대규모 데이터 구축 사업이다.

이번 사업은 경희대학교 산학협력단이 주관하며 플리토는 공동 수행 업체로 참여한다. 총 사업 규모는 약 38억원으로, 플리토는 이 중 전체 545만 어절과 음성 50만 어절, 총 595만 어절의 병렬 말뭉치 구축을 담당한다. ▲베트남어 ▲인도네시아어 ▲태국어 ▲힌디어 ▲크메르어 ▲타갈로그어 ▲러시아어 ▲우즈베크어 ▲영어 등 기존 9개 언어에 신규 언어 아랍어를 추가해 총 10개 언어 데이터 구축을 진행한다.

올해의 경우, AI 통번역 기술 개발을 위한 언어 자원으로 활용하기 위해 문장 단위에서 문단 단위로 변환해 병렬 말뭉치를 구축한다. 또한 기존 9개 언어에 대한 STS(Speech to Speech) 기반 말뭉치도 함께 구축해 AI 음성 인터페이스 성능 향상을 도모한다. 신규 언어·유형에 맞춘 평가 기준 및 도구 마련, 번역 플랫폼 개선 등 데이터 정제 및 검수 체계 고도화 연구도 병행한다.

플리토는 글로벌 시장에서 검증된 다년간의 데이터 정제 노하우를 바탕으로 국립국어원의 핵심 파트너로 자리매김했다. 그 결과, 이번 연도에 구축할 데이터까지 포함하면 음성 포함 누적 구축 어절은 약 6100만 개에 달할 예정이다.

구축한 데이터는 한국어와 동남아 지역 내 저자원 언어 데이터 부족 문제를 해소하고 국내외 AI 연구 및 기술 상용화에 활용된다. 이를 통해 글로벌 시장에서의 인공지능 기술 격차를 줄이고 문맥 이해와 추론 능력을 갖춘 차세대 번역 모델 개발 촉진에 기여할 것으로 기대된다.

이정수 플리토 대표는 “플리토의 언어 데이터 전문성과 검수 품질을 높이 평가받아 올해 국립국어원 말뭉치 구축 사업에 참여하게 돼 매우 기쁘다”며 “앞으로도 정부 및 연구기관과 협력해 고품질의 AI 언어 데이터를 지속적으로 공급함으로써 글로벌 시장에서 경쟁력 있는 데이터 중심 한국형 AI 모델 강국으로 자리매김하는 데 힘을 보태겠다”고 밝혔다.

◎공감언론 뉴시스 [email protected]

Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지

다음 구독베너

네이버 구독베너

많이 본 사진

안세영, 결승서 왕즈이와 재대결

안세영, 심유진 꺾고 결승서 왕즈이와 우승 다툼

영화 '6천원 할인' 티켓 450만장 배포

트로피에 입맞춤 하는 안세영

완도 수산물 냉동창고 화재 현장 수습중인 소방 당국

꽃신에 감동받은 메릴 스트립-앤 헤서웨이

8년만에 내한한 앤 헤서웨이

첫 내한 메릴 스트립

사랑스러운 아이유

선남선녀

훈훈한 변우석

뉴시스Pic

"시원하구나" 세종대왕 동상 봄맞이 세척 작업

정청래 "추미애는 민주당의 전략 자산… 선거 승리 위해 함께 할 것"

로리 매킬로이, 마스터스 2연패… 스코티 셰플러 1타 차로 제쳐

'친러' 빅토르 오르반, 총선 패배… 16년 만에 헝가리 총리직 물러나

그래픽뉴스

고유가 피해지원금, 국민 70%에 10만~60만원

그래픽뉴스

이시간 핫뉴스

지예은, 동갑내기 바타와 열애…'새삥' 안무가

'5월 결혼' 최준희, 11세 연상 신랑 깜짝 공개

'이윤진과 파경' 이범수 "이혼은 승자 없는 게임"

가수 이효리 부친상 비보…남편 이상순과 빈소 지켜

신봉선, 깁상샘 저하증 투병…"4년간 10㎏ 증가"

오늘의 헤드라인

"美 "밤 11시 이란 해상 전면 봉쇄"
이란 "저렴한 기름값 그리워질 것"

미군이 도널드 트럼프 대통령의 명령에 따라 이란에 대한 해상 봉쇄를 시행하면서도, 핵심 해상로인 호르무즈 해협에 대해서는 '제한적 통제' 방침을 내놨다. 미 중부사령부는 12일(현지 시간) 소셜미디어 성명을 통해 "대통령의 선언에 따라 동부시간 기준 13일 오전 10시(한국시간 13일 오후 11시)부터 이란 항구와 연안 지역을 드나드는 모든 선박을 봉

많이 본 기사

'5월 결혼' 최준희, 11세 연상 예비신랑 깜짝 공개

이범수, 이윤진과 파경 후 첫 심경 "이혼은 승자 없는 게임"

'41세' 전소민, 결혼 전에 2세 포기…"언제 낳아 키우냐"

미군 "이란 해상 전면 봉쇄…한국시간 오늘 오후 11시 시행"

이란 "국가 이익 위한 외교적 노력 지속…軍, 준비태세 유지"

이 대통령, 폴란드 총리와 정상회담…중동 정세·방산 협력 논의

트럼프, 교량·발전소 이어 수자원도 공격 엄포…"하루 만에 이란 제거 가능"

새벽 청주 상가서 폭발 사고…인근 주민 10여명 부상

이 대통령, 폴란드 총리와 정상회담…중동 정세·방산 협력 논의

국힘 공천 혼란 와중에 장동혁 미국행…"이 시점에 가야하나" 비판도

이 대통령 국정수행 '잘한다' 61.9%·'잘못한다' 32.8%

정부, 3년간 EDCF 9조원 승인 목표…AI·문화·공급망 중점 추진

정원오 "오세훈 10년 '용두사미'…당선되면 바로 한강버스 중단할 것"

이준석 "李대통령, 국격 깎아먹는 '국내용 화법' 버려야"

국회(4월13일 월요일)

정치(4월13일 월요일)

미군 "이란 해상 전면 봉쇄…한국시간 오늘 오후 11시 시행"

이란 "국가 이익 위한 외교적 노력 지속…軍, 준비태세 유지"

이 대통령, 폴란드 총리와 정상회담…중동 정세·방산 협력 논의

트럼프, 교량·발전소 이어 수자원도 공격 엄포…"하루 만에 이란 제거 가능"

트럼프 "美 해군, 호르무즈 봉쇄 착수…이란에 통행료는 불법"(종합)

미군 “美동부시간 13일 오전 10시부터 이란 항구 출입 전면 봉쇄”

WSJ "사우디, 韓 한화·LIG넥스원에 천궁-II 조기 인도 문의"

美 "이란 해상 전면 봉쇄" vs 이란 "휘발유값 급등"(종합)

WSJ "사우디, 韓 한화·LIG넥스원에 천궁-II 조기 인도 문의"

美 호르무즈 역봉쇄에…국제유가, 100달러 재돌파

끝나지 않는 중동전쟁, 경제전망·지표 혼조…2% 성장 빨간불

압구정5구역·신반포19·25차 '맞대결 성사'…누구 품으로

정부, 3년간 EDCF 9조원 승인 목표…AI·문화·공급망 중점 추진

대출 막혀도 신고가…'래미안 원펜타스' 100억 단지 합류

올영·무신사 만난 산업부, 'K-소비재' 해외 진출 전략 논의

기후부, '2035 NDC 수립·재생E 확대' 공로자 35명에 특별 포상

보험분쟁 사전 예방에 칼 뽑았다…금감원, 새 감독체계 가동

한화에어로 이어 한화솔루션까지…증권신고서 정정이란

美·이란 협상 결렬에 삼성전자·SK하이닉스 2%대 하락 출발

美·이란 협상 결렬에 '20만전자'·'100만닉스' 반납…2%대 동반 약세

美·이란 협상 결렬에 불안감 커진 코스피…변동성 확대 불가피

저축은행권 연봉 봤더니…상위사 임직원 평균 7000만~9000만원대

코스피, 美·이란 협상 결렬에 2%대 하락…5730선 출발

원·달러 환율, 12.9원 오른 1495.4원 출발

신약 개발 맞잡은 두 손…"생태계 키우고 환자 살린다"

"美 노선 50만원대 전망"…이번주 5월 국제 유류할증료 나온다

올영·무신사 만난 산업부, 'K-소비재' 해외 진출 전략 논의

기후부, '2035 NDC 수립·재생E 확대' 공로자 35명에 특별 포상

"최대 3억…대기업·정부 도움받고 탄소 배출 줄이세요"

"아울렛 가격서 한번 더 할인" 롯데아울렛·몰, '블랙슈퍼쇼' 진행

경제(4월13일월요일)

산업통상부(4월13일월요일)

신약 개발 맞잡은 두 손…"생태계 키우고 환자 살린다"

'툭하면 삐끗' 내 아이 혹시 평발?…신발밑창 보면 안다

과기정통부·방미통위·개보위(4월 13일 월요일)

"중국 CDMO 고속 성장"…더 거세진 글로벌 수주 경쟁

식품의약품안전처(4월13일 월요일)

셀트리온, 두드러기 치료제 유럽처방 확대…"조기 안착"

"내성 생겨도 약 없어"…한국, 항생제 신약 도입 '최하위'

HLB생명과학 "의료용 대마 원료의약품 연구 과제 참여"

서울 낮 최고 26도까지 올라 '포근'…짙은 안개

사망한 아들 AI로 재현한 中 가족…"매일 노모와 영상통화"

사냥 능력 없는 '늑구' 생존 골든타임 2~3일뿐…수색 당국 총력전

"마스크 쓴 김소영, 판사가 벗겨…살해 의도 없었다 끝까지 부인"

'툭하면 삐끗' 내 아이 혹시 평발?…신발밑창 보면 안다

기후부, '2035 NDC 수립·재생E 확대' 공로자 35명에 특별 포상

뉴시스 콘텐츠 저작권 고지

그룹사에 고객 신용정보 유출…法 "과징금 처분 과해 취소해야"

전화 한 통으로 불거진 민주당 최병민 오산시장 경선 후보 자격 '박탈'

정원오 "오세훈 10년 '용두사미'…당선되면 바로 한강버스 중단할 것"

민주당 경기도당, 최병민 오산시장 예비후보 자격 박탈

민주당 용인시장 후보 현근택 확정…국힘 이상일과 대결

인천, 일교차 15도 이상…최고기온 25도

"교육 공무원, 교육감 선거 특정 후보 지지 안돼요"

경기남부(4월13일 월요일)

인천·김포·부천(4월13일 월요일)

새벽 청주 상가서 폭발 사고…인근 주민 10여명 부상

제주-인천 10년만의 부활…'닫힌 지갑' 열리나?

"포탄 소리에 잠 깼다" 새벽 음식점 폭발 사고로 주민 15명 부상(종합)

대구·경북, 내륙 중심 큰 일교차…아침 7도·한낮 25도

"미술·영화·음악까지"…대구 구수산도서관, 야간 인문학 강연

부산(4월13일 월요일)

'흉기' 갖고 광주 월드컵경기장 입장 막히자…배회→자해

나주 물류창고 앞 집회서 경찰-노조 충돌…7명 부상

"미술·영화·음악까지"…대구 구수산도서관, 야간 인문학 강연

퇴근 후 두 대의 휴대폰…SNS서 '살고 싶다' 신호 찾는 감시단장

‘하나뿐인 우리 아이’ 위해서라면…노보텔 동대문, VIB 겨냥 돌잔치 페어

문화체육관광부(4월13일 월요일)

대구 서구문화회관, 봄맞이 '이현공원 숲속음악소풍' 개최

불황에도 미술은 팔렸다…5만명 몰린 화랑미술제 "시장 살아있다"

SK·포도뮤지엄, 美 메트·아시아미술관과 협력…“여성예술·韓 미술 세계화 지원”

유럽서 주목한 한국 비디오아트…"한류 이면 드러내"

U-20 여자 축구, 3회 연속 월드컵 본선 진출…북한과 4강전

매킬로이, 마스터스 2연패…우즈 이후 24년 만에 역대 4번째

야구 전설 이름에 먹칠…이종범의 한없이 가벼운 언행

매킬로이, 우즈 이후 24년 만에 마스터스 골프 2연패 달성

매킬로이, 마스터스 2연패…우즈 이후 24년 만에 역대 4번째(종합)

스포츠클라이밍 이도현, 아시아선수권 남자부 볼더링 우승

백승호 시즌 첫 도움…英 2부 버밍엄시티, 렉섬 2-0 제압

로리 매킬로이, 마스터스 2연패… 스코티 셰플러 1타 차로 제쳐

'5월 결혼' 최준희, 11세 연상 예비신랑 깜짝 공개

이범수, 이윤진과 파경 후 첫 심경 "이혼은 승자 없는 게임"

'41세' 전소민, 결혼 전에 2세 포기…"언제 낳아 키우냐"

"안성재 모수홍콩 일매출 2천만원에 월세 6천만원"

방탄소년단 '아리랑', K-팝 최초 '빌보드 200' 3주 연속 1위

이민정, 폭풍 성장 딸 공개…"벌써 한 살, 시간 빠르다"

김혜윤 호러 통했다…'살목지' 첫 주말 53만명 1위에

방탄소년단 '아리랑', K-팝 최초 3주 연속 '빌보드 200' 1위(종합)

뉴시스 기획특집

엇박자 금리

CDMA 30년

삼천당제약 거품 논란

포스코 직고용 결단

양도세 중과 D-30

많이 본 기사

야구 전설 이름에 먹칠…이종범의 한없이 가벼운 언행

39년 만에 온 개헌 물꼬, 정쟁 아닌 국민 이익 관점에서 풀어야

세상 피로 덜어내는 도피처…윤마치, 눈부신 취향에 속절없이 '만취'

패럴림픽 첫 메달 쥔 이제혁 "수많은 응원에 행복"[당신 옆 장애인]

샤브샤브 속 이물질, 자세히 보니 '벌레'?…"토할 것 같다"

뉴스

광장

포토

패밀리사이트

제휴사

모바일앱서비스

Android
IOS

뉴시스 구독

대표이사 : 염영남 주소 : 서울 중구 퇴계로 173 남산스퀘어빌딩 (구 극동빌딩) 12층 사업자등록번호 : 102-81-36588

발행인 : 염영남 편집인 : 염영남 고충처리인 : 김경원 통신판매업신고 : 서울중구 0398호 문의 02-721-7400 [email protected]

뉴시스의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재ㆍ복사ㆍ배포를 금합니다. Copyright © NEWSIS.COM All rights reserved.