• 페이스북
  • 트위터
  • 유튜브

한컴, PDF문서에서 AI 학습 데이터 추출하는 '데이터 로더' 글로벌 출시

등록 2024.04.18 08:56:32

  • 이메일 보내기
  • 프린터
  • PDF

PDF·오피스 문서에서 AI 학습용 데이터로 추출

"국내 대기업 테스트 마치고 글로벌 세일즈 본격화"

한글과컴퓨터 CI(사진=한글과컴퓨터 제공) *재판매 및 DB 금지

한글과컴퓨터 CI(사진=한글과컴퓨터 제공) *재판매 및 DB 금지


[서울=뉴시스]송혜리 기자 = 한글과컴퓨터(이하 한컴)는 PDF 문서에서 인공지능(AI) 학습용 데이터를 추출하는 소프트웨어개발키트(SDK) '한컴 데이터 로더(Loader)'를 출시하고 글로벌 시장에 선보인다고 18일 밝혔다.

한컴 데이터 로더는 전자문서 형식인 PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷(JSON·CSV·TXT·XML 등)으로 변환해 주는 도구다. PDF뿐만 아니라 오피스 문서에서도 텍스트 외 다양한 객체를 AI 학습용 데이터로 추출해 제공한다.

한컴 측은 "지난 35년간 축적한 문서 기술을 바탕으로 문서의 AI 데이터화를 위한 전처리 기술을 모듈화해 '한컴 데이터 로더'라는 SDK 제품을 개발했다고 설명했다.

한컴 데이터 로더는 국내 대기업을 대상으로 테스트를 이미 마쳤다. 다음달부터는 국내를 비롯해, 최근 투자한 스페인 AI 보안 기업 페이스피의 네트워크와 글로벌 고객사를 연계해 유럽 시장을 우선 공략한다. 한컴은 최근 해외 고객을 대상으로 한컴 데이터 로더뿐만 아니라 한컴의 AI 기술과 SDK 기술을 소개하는 해외향 다국어(영어·독일어·스페인어·일어) 사이트도 열고, 본격적인 글로벌 출시를 알렸다.

김연수 한컴 대표는 "올해를 글로벌 빅테크 기업으로 나아가는 원년으로 삼고, 인수·투자·협력을 여러 방면으로 진행하며 AI 사업을 본격화하고 있다"고 말했다. 이어 "한컴 데이터 로더로 글로벌 AI 시장에 빠르게 침투하여 AI 기업으로서 의미 있는 성과를 분명하게 만들어 나가겠다"고 강조했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사