• 페이스북
  • 트위터
  • 유튜브

"여기 어디 같아?" 묻자 "행사장" 답하는 구글 AI…보고 듣고 말한다

등록 2024.05.15 05:14:48수정 2024.05.15 05:54:52

  • 이메일 보내기
  • 프린터
  • PDF

구글 I/O서 '제미나이' 신규 모델 공개…100만개 문맥 창 갖춰

구글 검색에 AI 결합해 복잡한 검색까지…동영상 검색도 추가

[마운틴뷰=AP/뉴시스]순다르 피차이 구글 최고경영자(CEO)가 14일(현지시각) 미국 캘리포니아 마운틴뷰에서 진행된 연례 개발자 회의 '구글 I/O'에서 연설하고 있다. 2024.5.14.

[마운틴뷰=AP/뉴시스]순다르 피차이 구글 최고경영자(CEO)가 14일(현지시각) 미국 캘리포니아 마운틴뷰에서 진행된 연례 개발자 회의 '구글 I/O'에서 연설하고 있다. 2024.5.14.

[서울=뉴시스]윤현성 기자 = 구글이 자사의 AI(인공지능) 모델 '제미나이(Gemini)'의 최신 버전인 '제미나이 1.5 프로'를 전세계 이용자들이 사용할 수 있도록 개방하고, 프로보다 더 가볍고 빠른 '제미나이 1.5 플래시'도 새롭게 선보였다.

구글은 구글 검색 기능에 제미나이를 결합해 보다 복잡한 검색을 가능하도록 하고, AI가 사용자별 맞춤형 검색 페이지도 제공할 수 있도록 할 예정이다. 카메라 앱에도 제미나이를 결합해 AI가 특정 상황을 살펴본 뒤 그에 대한 해답을 내놓는 기술도 공개됐다.

구글은 14일(현지시각) 미국 캘리포니아 마운틴뷰에서 연례 개발자 회의 '구글 I/O 2024'를 개최하고 제미나이 중심의 새로운 AI 기술들을 선보였다.

구글의 최신 AI 모델인 제미나이 1.5 프로는 전용 서비스인 '제미나이 어드밴스드'를 통해 모든 이용자들에게 제공된다. 제미나이 1.5 프로는 100만개의 토큰을 한번에 지원하는 '문맥 창(Context Window)'을 갖추고 있다. 개발자들은 200만개까지 토큰을 활용할 수 있다.

AI 모델이 명령을 처리할 때는 답변을 생성하는 동안 확인할 수 있는 정보의 양이 제한된다. 이때 검토·확인할 수 있는 텍스트 범위의 제한이 바로 문맥창이다. 문맥 창의 크기가 클수록 AI의 정보 처리 능력 등 성능이 올라가는 셈이다. 제미나이 1.5 프로의 문맥 창은 수십만개의 단어를 동시에 처리할 수 있는 수준으로 알려졌다. 구글에 따르면 해당 모델은 1500페이지에 달하는 여러 개의 대규모 문서를 한번에 이해하거나, 100개의 이메일을 한번에 요약할 수 있다.

보다 지연시간이 짧은 작업에 최적화된 제미나이 1.5 플래시도 이번 구글 I/O에서 공개됐다. 프로 모델과 같이 문맥 창의 범위가 100만개(개발자용 200만개)에 달하는 압도적인 능력을 갖고 있다. 다만 프로 모델보다는 더 가벼운 버전으로, 더 빠른 응답 속도를 보인다.
[마운틴뷰=AP/뉴시스]14일(현지시각) 미국 캘리포니아 마운틴뷰에서 진행된 연례 개발자 회의 '구글 I/O'에서 방문객들이 행사 로고 사진을 촬영하고 있다. 2024.5.14.

[마운틴뷰=AP/뉴시스]14일(현지시각) 미국 캘리포니아 마운틴뷰에서 진행된 연례 개발자 회의 '구글 I/O'에서 방문객들이 행사 로고 사진을 촬영하고 있다. 2024.5.14.

구글은 이렇게 강화된 제미나이가 지메일, 카메라, 구글 검색 등에 결합될 것이라고 밝혔다. 제미나이 1.5 프로는 이메일 요약 뿐만 아니라 화상회의 앱인 '구글 밋'을 녹화해 중요한 내용을 강조해주는 등의 역할까지 하게 된다.

아울러 구글 검색에 제미나이가 결합되며 이전처럼 단순한 단어만 검색하는 것이 아니라 AI 챗봇에 물어보듯이 더 복잡한 검색까지 할 수 있게 될 전망이다. 이를 두고 구글은 '다단계 추론'이 가능해질 것이라고 강조했다.

예컨대 '요가 학원'만 검색하는 게 아니라 '우리 동네에서 가장 좋은 요가 또는 필라테스 학원을 찾아줘. 그 곳은 어떤 곳인지, 또 우리 집에서 도보로 얼마나 걸리는지, 제공하는 혜택은 무엇인지 자세히 알려줘'와 같은 검색이 가능해지는 셈이다.

또한 사용자별로 맞춤형·개인화된 전용 검색 페이지도 제공되며, 이미지 검색을 넘어 비디오 검색까지도 가능해질 예정이다. 구글은 이처럼 구글 검색에 AI가 결합된 기능들이 향후 수 주 안에 출시될 것이라고 발표했다.

또 하나 눈에 띄는 AI 기능은 제미나이와 카메라 앱의 결합이다. 구글은 단순히 텍스트에 국한된 AI 기능만이 아니라 AI가 사진이나 동영상, 아니면 카메라가 현재 촬영 중인 환경을 관찰·이해하고 필요한 답변을 내주는 기능을 선보였다.

구글이 공개한 기술 데모를 살펴보면 제미나이는 사용자가 과거에 보여준 모습을 기억해낸다. 구글은 카메라에 다양한 물건이 놓인 여러 개의 책상을 보여주고, 그와 관련된 무작위 질문들을 수차례 늘어놨다. 이후 제미나이에게 "내 안경을 마지막에서 어디에서 보았나"고 물으면 "네 안경은 O번째 테이블에 빨간 사과 옆에 있었다"라고 답해주는 식이다.

또 구글은 이번 구글 I/O 행사 하루 전에도 소셜미디어(SNS)를 통해 카메라에 담긴 제미나이 기능을 선보이기도 했다. 구글 I/O 행사가 준비 중인 모습을 카메라에 담은 뒤 "무슨 일이 벌어지고 있는 것 같아?"라고 묻자 제미나이가 "사람들이 큰 행사, 아마도 회의나 프레젠테이션을 준비하는 것 같다"고 답했다.

이외에도 구글은 이번 행사에서 동영상 생성 모델 '비오', 이미지 변환 모델 '이마젠3', AI 개발용 오픈 모델 '젬마 2.0' 등의 새로운 AI 기술들을 선보였다.

순다르 피차이 구글 최고경영자(CEO)는 이날 행사에서 "우리는 1년 전 I/O에서 제미나이에 대한 계획을 처음 공유했다. 이제 150만명 이상의 개발자들이 제미나이를 활용하고 있고, 20억명이 넘는 사용자도 확보하게 됐다"며 "구글은 이제 제미나이 시대에 완전히 들어갔다. 모든 사람들이 제미나이가 할 수 있는 일을 통해 혜택을 받길 바란다"고 말했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사