"대답만 하는 AI스피커 가라"…질문도 하는 네이버 '클로바'
문맥 이해하고 공감능력 향상된 초대규모 AI '하이퍼 클로바' 적용
외국산보다 한국어 구사 능력 뛰어나 국내 시장에서 경쟁력 입증
꾸준한 한국어 학습 통해서 자유주제로도 질의응답 기대
![네이버가 만든 초대규모 AI 하이퍼 클로바가 적용된 '똑똑사전' [사진=네이버] *재판매 및 DB 금지](https://img1.newsis.com/2022/04/15/NISI20220415_0000975875_web.jpg?rnd=20220415170607)
네이버가 만든 초대규모 AI 하이퍼 클로바가 적용된 '똑똑사전' [사진=네이버] *재판매 및 DB 금지
【서울=뉴시스】송종호 기자 = 인공지능(AI) 스피커가 똑똑해졌다. "오늘의 날씨는" "아이유 노래 들려줘" 등 과거 묻는 말에 답을 하거나 명령을 수행했던 AI 스피커가 이제 이용자에게 말을 걸고 대화를 한다.
그 중심에 네이버가 있다. 네이버는 차별화된 한국어 능력을 갖춘 초대규모 AI ‘하이퍼 클로바’를 꺼내들었다. 초대규모 AI는 자율적으로 사고·학습·판단·행동하는 인간의 뇌 구조를 닮은 AI를 말한다.
“걔보다 작은 공룡도 알려줘” 대화로 돌아온 클로바 스피커
클로바 스피커에 “똑똑사전과 대화할래”로 명령하면 해당 기능을 시작할 수 있다. 현재 △공룡 △우주 △반려동물 등 총 3개 주제로 대화할 수 있다.
똑똑사전의 특징은 네이버의 초대규모 AI ‘하이퍼클로바’가 적용돼 꼬리에 꼬리를 무는 연속적인 대화가 가능하다는 것이 장점이다.
“지구에서 가장 큰 공룡은 뭐야?”고 질문했다면, 이어서 “그럼 코끼리보다 얼마나 커?”라고 물어도 적절하게 답변해주는 식이다. 기존에는 AI 스피커가 답변한 공룡 이름을 정확하고 크게 말해서 물어봐야 했다.
대화를 자연스럽게 이어나갈 수도 있다. 예를 들어 사용자가 몇 초간 응답이 없으면 “코끼리보다 작은 공룡을 알려드릴까요?”라며 이용자에게 질문을 하기도 한다.
네이버는 답변도 더 풍부해졌다고 설명했다. 이번 출시를 위해 네이버 클로바는 지식백과, 지식인(iN)에서 공룡, 우주, 반려동물 주제와 관련된 다양한 질의와 답변을 자동으로 추출해 학습했다. 미리 학습하지 않은 질의에 대해서도 검색 결과를 기반으로 답변을 생성할 수 있다.
네이버 관계자는 “똑똑사전은 호기심이 많은 아이들의 궁금증을 빠르게 해결해줄 수 있어 아이가 있는 가정에서 특히 유용할 것으로 기대된다”고 설명했다.
네이버는 앞으로 그리스 로마 신화’와 같이 아이들이 좋아하는 주제로 똑똑사전을 확장한다는 계획이다. 또 어른들도 스피커를 더욱 유용하게 사용할 수 있도록 건강, 생활꿀팁 등 다양한 생활 주제를 추가해나갈 예정이다.
정석근 네이버 클로바 CIC 대표는 “AI 스피커에 초대규모 AI를 적용하는 것은 네이버가 최초다”며 “그 동안은 AI 스피커에게 주로 명령을 했다면, 이제는 자연스럽게 대화하는 것 같은 경험이 가능해질 것”이라고 말했다.
클로바 경쟁력은 ‘한국어 능력’…5600억 말뭉치 학습
‘하이퍼 클로바’와 같은 초대규모 AI는 인간의 뇌 구조를 닮았다. 자율적으로 사고·학습·판단·행동할 수 있다. 대표적인 사례가 일론 머스크 테슬라 최고경영자(CEO)가 주도해 설립한 ‘오픈(Open)AI’가 지난 2020년 공개한 ‘GPT-3’이다. 하지만 GPT는 치명적인 약점이 있다. 바로 GPT-3의 학습 데이터 대부분이 영어라는 점이다.
네이버는 이 틈을 파고 들었다. 한국어에 최적화한 AI모델을 개발해 외국산 AI가 하지 못하는 사업에서 주도권을 잡겠다는 것이다. 한국어의 문맥을 이해하고, 공감할 수 있는 AI 개발에 나선 것이다.
이 같은 취지 속에 개발된 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습했다. 이를 위해 네이버는 5600억 토큰(말뭉치)의 한국어 대용량 데이터를 구축했다. 이는 한국어 위키피디아의 2900배, 뉴스 50년치, 블로그 9년치에 달하는 규모다. 학습에는 3000억 토큰을 사용했다. 이 같은 초거대 AI를 개발하기 위해 네이버는 지난 2020년 10월 700페타플롭(PF) 성능 슈퍼컴퓨터를 도입한 바 있다. 이 700페타플롭이면 1초에 70경번의 소수부동점 연산이 가능한 성능이다.
이렇게 한국어를 학습한 하이퍼클로바는 우리말을 가장 잘 이해하고 구사할 수 있는 최초의 초대규모로 거듭났다. 네이버 측은 “이용자가 굳이 모든 문장을 완벽하게 구사해서 내 의도를 전달하지 않아도 편하게 대화할 수 있는 수준”이라고 설명했다.
다만 현재 하이퍼 클로바는 모든 자유주제에서 자연스러운 대화는 어려운 것으로 알려졌다. 이를 해결하기 위해 네이버는 하이퍼 클로바에 끊임없는 한국어 학습을 시키고 있다.
네이버 관계자는 “지금은 모든 주제에서 사람과 동일한 수준의 대화를 할 수 있는 단계는 아니다”라면서도 “꾸준히 학습해 데이터를 쌓아가고 있다”고 말했다.
이어 “학습 데이터가 쌓일수록 표현하는 언어가 자연스러워진다. 조만간 새로운 질문에도 막힘없이 답하는 수준으로 대답할 수 있을 것”이라고 밝혔다.
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지





























