• 페이스북
  • 트위터
  • 유튜브

"사람과 공감하는 인공지능"…KT, AI 2.0 청사진 공개

등록 2022.05.22 09:00:00수정 2022.05.22 09:30:59

  • 이메일 보내기
  • 프린터
  • PDF

음성인식·패러프레이징·AICC 클라우드·AI 시각지능 등 개발

핵심은 '초거대 AI'…내년까지 파라미터 2000억개로 확대

배순민 소장 "KT 모토는 'Beyond AI'…따뜻한 '감성 AI' 필요해"

배순민 KT 융합기술원 AI2XL연구소 소장과 연구진들이 지난 19일 오전 서울 서초구 융합기술원에 열린 '9회 KT 디지코 스터디'에서 'KT AI 2.0' 관련 질의에 답하고 있다. (사진=KT 제공) *재판매 및 DB 금지

배순민 KT 융합기술원 AI2XL연구소 소장과 연구진들이 지난 19일 오전 서울 서초구 융합기술원에 열린 '9회 KT 디지코 스터디'에서 'KT AI 2.0' 관련 질의에 답하고 있다. (사진=KT 제공) *재판매 및 DB 금지


[서울=뉴시스]윤현성 기자 = "기술적 측면에서의 AI(인공지능)는 이미 일정 수준 이상에 올랐다. 이제는 그 이상이 필요하다. 인간과 공감할 수 있는 AI를 내놓겠다."

KT가 '초거대 AI' 기술을 기반으로  각종 AI 서비스를 한단계 진화시킨 'AI 2.0' 시대를 열겠다고 선언했다. 이용자를 돕는 수준을 넘어 이용자를 위로하고 공감하는 감성적 AI로 발전시키겠다는 구상이다.

22일 KT에 따르면 이 회사는 ▲청각지능 부문의 'E2E(엔드 투 엔드) 음성인식 ▲언어지능 부문의 '초거대 AI 패러프레이징(의역)' ▲클라우드 부문의 'AICC(AI 컨택트 센터) NLP 멀티클라우드' ▲시각지능 부문의 '동작인식'과 '객체검출' 기술을 각각 개발 중이다.

음성→텍스트로 바꿔주는 'E2E 음성인식'…학습량 늘수록 성능 강화

먼저 KT가 독자 개발 중인 E2E 음성인식 시스템은 AI가 사용자의 '음성'을 인식해 '텍스트(글자)'로 바꿔준다.

KT가 개발 중인 음성인식기는 학습데이터가 많아질수록 성능이 강화된다. 학습데이터가 쌓일 수록 자연스러운 일상 대화 뿐만 아니라 강연·방송·전화 통화 등 다양한 형태의 음성에 대한 인식율이 높아지는 식이다. 기존의 음성인식기와 비교했을 때 보다 적은 양의 학습데이터로도 다양한 형식의 발화(소리내어 말하는 것)에까지 적용될 수 있다.

E2E 음성인식이 적용된 KT의 '지니속기사'의 경우 유튜브 동영상 링크 등을 첨부하면 해당 영상 속 음성을 모두 텍스트로 전환한다. 텍스트화된 발화 내용들은 가독성을 고려해 발화 사이사이 '공백'이 있을 때 문단을 나누는 식으로 구성된다.

특히 KT는 자사의 E2E 엔진이 타사의 엔진과 달리 사용자가 말하는 순간순간의 음성을 실시간 처리해 사용자에게 제공해준다고 강조했다. KT는 E2E 음성인식 기술을 고도화해 정확한 발화 내용 파악 등이 중요한 콜센터나 방송계 등을 공략할 계획이다.
KT 융합기술원 AI2XL연구소 'Speech Recognition Project' 이정한 전임연구원이 E2E 음성인식 AI 기술을 활용해 영상 음성을 텍스트로 옮기는 시연을 진행하고 있다. (사진=KT 제공) *재판매 및 DB 금지

KT 융합기술원 AI2XL연구소 'Speech Recognition Project' 이정한 전임연구원이 E2E 음성인식 AI 기술을 활용해 영상 음성을 텍스트로 옮기는 시연을 진행하고 있다. (사진=KT 제공) *재판매 및 DB 금지

AICC NLP 멀티클라우드 기술, 금융권 등 'B2B' 초점…올해 2000억원 이상 수주 목표


KT의 NLP(자연어 처리) 솔루션은 특정 문장을 들으면 그 문장의 '의도'를 분류하고 문장의 핵심 키워드인 '개체명'을 인식해준다.

예를 들면 "3월 핸드폰 요금이 얼마냐"고 묻는 문장에 대해서는 '청구_요금_문의'로 의도를 분류하고, '3월'이라는 개체명을 인식하게 되는 방식이다. 이렇게 NLP 솔루션을 통해 문장에 대한 해석이 이뤄지면 AICC의 고객 맞춤형 AI 콜센터 솔루션을 거쳐 "3월 청구 요금은 3만원이다"라는 답변이 고객에게 최종적으로 전해지게 된다.

KT의 AICC NLP 멀티클라우드 기술은 주로 B2B(기업대상) 시장에 초점을 두게 될 전망이다. KT는 현재 금융권을 중심으로 확산 중인 AICC의 대화 품질을 비약적으로 향상시키고, 향후 다양한 산업 분야에 최적화된 서비스도 구현하겠다고 강조했다.

특히 KT는 콜센터 등 산업 현장에서 종사원들의 단순응대 노동을 최소화에 AI가 적용된 분야의 산업 생산성을 30% 이상 높일 수 있다고 기대를 표했다. 고도화된 AICC 솔루션을 통해 올해 2000억원 이상의 AICC 수주를 달성하겠다는 사업 목표도 밝혔다.

B2C(소비자 대상) 사업의 경우에는 아직 구체화된 단계는 아니나, 주로 소상공인을 대상으로 SaaS형(서비스형 소프트웨어) 클라우드를 기반으로 지원될 전망이다. 이미 상용화돼있는 AI 통화비서 등과 연계될 가능성도 있다.

C-ITS에 활용되는 '객체 검출기', K팝 연계한 '동작인식' 기술도 개발

지능형 교통체계(C-ITS)에 활용되는 '객체 검출기'와 K팝 등 문화 콘텐츠와 연계될 '동작인식형 리얼 댄스 서비스'도 AI 2.0의 한 축을 맡게 된다.

C-ITS 객체 검출기인 'KT 로드 아이즈(ROAD EYES)'는 도로교통환경을 감시하는 CCTV 영상 내 존재하는 차량이나 보행자 등을 실시간 검출하는 시스템이다. 십자 모양 표식으로 물체들을 검출하게 되는데, 승용차(초록색)·트럭(하늘색)·버스(분홍색)·보행자(노란색) 등 색깔로 대상을 구분한다.

KT는 로드 아이즈가 빗물·눈·역광 등 환경적 어려움이나 차량·사람 간 가려짐이 발생해도 대상 검출이 원활히 이뤄진다고 강조했다. 기존에 객체 검출을 위해 쓰이던 'Y 검출기'와 비교해보면 더 작은 객체까지 세세하게 구분할 수 있어 검출 표식이 2배 이상 많이 나타난다.

보다 세세한 객체 검출을 통해 도로 정체 여부 등의 파악이 용이해지는 등 로드 아이즈가 C-ITS 정착에 기여할 수 있다는 게 KT의 설명이다.
KT 융합기술원 AI2XL연구소 로봇비전 Projrct 박진욱 책임연구원이 C-TIS 솔루션에 활용되는 객체검출 AI 기술을 설명하고 있다. (사진=KT 제공) *재판매 및 DB 금지

KT 융합기술원 AI2XL연구소 로봇비전 Projrct 박진욱 책임연구원이 C-TIS 솔루션에 활용되는 객체검출 AI 기술을 설명하고 있다. (사진=KT 제공) *재판매 및 DB 금지

리얼 댄스 서비스는 K팝 댄스 콘텐츠의 일종으로, 사용자가 자신의 춤을 촬영하면 AI 기반 분석을 통해 피드백을 제공한다. KT는 실제 사용자 1600여명의 춤 영상을 전문가에 전달해 평가 데이터를 확보한 뒤 이를 바탕으로 AI 네트워크를 구축했다고 설명했다.

스마트폰 등으로 촬영한 춤 영상을 입력하면 AI 딥러닝 기반 추론이 진행돼 강사와 사용자의 동작 유사도를 비교하고, 춤을 추는 동안의 운동량을 추론해 평가 점수를 산출하게 된다. 흥미도를 높이기 위해 강사의 동작과 싱크로율이 맞을 때마다 마치 리듬게임 처럼 'Good', 'Perfect'와 같은 평가가 즉각 표출되기도 한다. 평가 점수와 함께 베스트·워스트 구간도 AI 분석을 바탕으로 제공된다.

문장 생성·대화 1줄 요약 등 '패러프레이징' 기술로 상담 업무 돕는다

초거대 AI를 통한 패러프레이징 기술도 콜센터 등에서 근무하는 상담사들의 업무를 돕는 데 활용될 수 있을 전망이다.

먼저 KT의 초거대 AI 패러프레이징 기술은 '같은 뜻'을 갖고 있지만 '표현'이 다른 문장을 원하는 만큼, 수백개 이상 생성해준다. 예컨대 "5G 폰으로 바꿨는데 가입된 요금제 이름이 뭐에요"라는 문장을 "핸드폰을 5G로 변경했을 때 쓰는 요금제 이름이 뭐죠"와 같이 바꾸는 식이다.

KT는 이렇듯 다양한 형태의 문장을 만들어내는 이유에 대해 AI 상담사나 보이스봇 등에게 보다 효율적인 학습을 제공하기 위함이라고 설명했다. 똑같은 의도를 가진 고객이더라도 사람에 따라 수천가지 표현이 가능하기 때문에 최대한 많은 형태의 발화·문장에 대한 학습이 필요하다는 것이다.

초거대 AI가 상담을 비롯한 장문의 대화 내용을 짧게 압축하거나 아예 '한 문장'으로 요약해주는 기능도 있다. 해당 기능의 효용성을 두고 KT는 "상담원들이 상담 내용 등을 전달 받을 때 긴 대화록을 다 읽어보고 상황을 파악해야 하는데 그 시간이 너무 오래 걸린다는 지적이 많다. 이런 요약 기능 요청이 실제로도 많았던 만큼 현장에서 유용하게 사용될 수 있을 것"이라고 설명했다.

AI 2.0 핵심은 '초거대 AI'…내년까지 파라미터 규모 20배 확대 목표

KT는 향후 모든 AI 서비스의 도약을 위한 핵심 기술로 '초거대 AI'를 꼽았다. 초거대 AI 개발을 위해 KT는 산·학·연이 모두 협력하는 'AI 원팀'을 꾸려 연구를 진행하고 있다. KT와 AI 원팀은 초거대 AI 모델을 올해 중 상용화할 계획이다.

초거대 AI의 성능은 파라미터(매개변수) 규모의 영향을 크게 받는다. KT는 현재 110억개 상당의 파라미터를 확보하고 있는데 올해 안에 300억개, 내년까지 2000억개 이상의 모델까지 가능하도록 인프라 규모를 점진 확대하는 것을 목표로 하고 있다. 현재 KT 초거대 AI 모델링은 이론적으로 최대 5400억개의 파라미터 사이즈를 확보할 수 있는 것으로 분석됐다.
KT 융합기술원 KT 융합기술원 AI2XL연구소 배순민 소장이 지난 19일 오전 서울 서초구 융합기술원에 열린 '9회 KT 디지코 스터디'에서 'KT AI 2.0'의 연구 방향성을 발표하고 있다. (사진=KT 제공) *재판매 및 DB 금지

KT 융합기술원 KT 융합기술원 AI2XL연구소 배순민 소장이 지난 19일 오전 서울 서초구 융합기술원에 열린 '9회 KT 디지코 스터디'에서 'KT AI 2.0'의 연구 방향성을 발표하고 있다. (사진=KT 제공) *재판매 및 DB 금지

이외에도 KT는 AI원팀과 함께 초거대 AI와 KT 클라우드를 기반으로 한 개방형 R&D(연구개발) 생태계를 조성하고, '지니랩스(GenieLabs)'라는 이름의 AI 연구개발 포털을 오픈해 KT AI를 금융·차량·로봇·물류 등 다양한 산업분야로 확산해나가겠다고 밝혔다. KT 초거대 AI가 클라우드를 통해 다른 기업 및 기관들과 공동 성장해나간다는 목표다.

배순민 KT 융합기술원 AI2XL 연구소장은 타운홀 인터뷰를 통해 "KT의 모토는 'Beyond AI'다. 현재 AI 기술들이 많이 있지만 현재의 차원을 넘어 다음 단계를 향하고자 하는 것"이라며 "앞으로는 이성적 AI 뿐 아니라 공감할 줄 아는 따뜻한 감성적 AI가 필요하다고 생각한다. 이를 위해 수백만의 실제 AI 서비스 사용자들이 초거대 AI를 즉시 문제 해결에 활용할 수 있도록 빠른 상용화를 위한 기술 개발을 병행해 나가겠다"고 말했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사