• 페이스북
  • 트위터
  • 유튜브

세계기록유산 유교책판, 인공지능(AI)과 만나다

등록 2021.04.05 10:40:20

  • 이메일 보내기
  • 프린터
  • PDF

한국국학진흥원, 한자 자동인식 시스템 개발

현재 한자 인식율 정확도 80%까지 끌어올려

OCR(광학문자인식) 변환 화면 이미지 (사진=한국국학진흥원 제공) *재판매 및 DB 금지

OCR(광학문자인식) 변환 화면 이미지 (사진=한국국학진흥원 제공) *재판매 및 DB 금지

[안동=뉴시스] 김진호 기자 = 고서 속 한자를 자동 인식할 수 있는 시스템 개발사업이 성과를 내고 있다.

한국국학진흥원은 한국지능정보사회진흥원(NIA) 지원 아래 ㈜누리 IDT, ㈜NHN다이퀘스트, ㈜에프아이솔루션과 함께 고서 속 한자를 자동 인식할 수 있는 시스템 개발 1차년도 사업을 완료했다고 5일 밝혔다.

1차 년도 사업 결과 세계기록유산인 유교책판 활자 등 고서의 한자 인식률 정확도를 80%까지 끌어올렸다.

이번 '한자 인식 OCR(광학문자인식) 인공지능 모델 개발'은 인공지능(AI)이 가진 딥러닝(Deep Learnimg) 기술이 차용됐다.

고서에 비교적 정자체로 기록된 한자의 다양한 이미지를 컴퓨터 텍스트 기호인 유니코드로 인식하도록 학습시키는 데이터셋을 구축했다.

1차년도 사업에서는 글자수 기준 1000만자의 이미지를 입력하고, 이를 인공지능에 지속적으로 학습시켰다.

앞으로 더 많은 글자 이미지를 입력하고, 인공지능 학습이 지속되면 인식률은 더 높아질 것으로 기대된다.

정종섭 한국국학진흥원장은 "산적해있는 고서들을 활용하기 위한 첫단계가 디지털화 작업"이라며 "이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다"고 말했다.

그는 이어 "향후 이미지 인식률을 높일 수 있는 사업을 계속 추진하겠다"며, "이 결과물이 일반인들이 실생활에서 활용할 수 있는 서비스까지 이어질 수 있도록 노력하겠다”고 밝혔다.


◎공감언론 뉴시스 [email protected]

많이 본 기사