남들 챗GPT 쫓을 때 영상AI 판 트웰브랩스…네이버·아마존 실탄 투입

등록 2026.07.03 06:00:00수정 2026.07.03 06:14:24

1500억원 규모 시리즈B 투자 유치 완료…누적 3000억원

네이버가 발굴하고 아마존이 주요 투자자로 가세

이재성 대표 "남들이 가지 않은 길 선택…비디오 슈퍼인텔리전스 시대 열 것"

[라스베이거스=뉴시스] 송혜리 기자 = 이재성 트웰브랩스 대표가 미국 라스베이거스에서 현지시각 12월 1일 개막한 '아마존웹서비스(AWS) 리인벤트 2025'에서 차세대 영상 AI 모델 '마렝고(Marengo)3.0'을 소개하고 있다. *재판매 및 DB 금지

[서울=뉴시스]오동현 기자 = "업계가 언어 모델에 집중하던 시기에 우리는 다른 방향을 택했다."

5년 전 인공지능(AI) 업계의 시선이 온통 '텍스트'에 쏠려 있을 때, "답은 영상에 있다"고 확신한 스타트업이 있다. 그 확신에 이번엔 아마존이 지갑을 열었다.

영상 AI 기업 트웰브랩스는 1억 달러(약 1500억원) 규모의 시리즈B 투자 유치를 완료했다고 2일 밝혔다. 누적 투자액은 2억 달러(약 3000억원)를 넘어섰다.

이번 라운드는 글로벌 벤처캐피탈(VC) NEA와 네이버벤처스가 공동 주도했고, 아마존이 주요 투자자로 참여했다. 래디컬벤처스, 한국투자파트너스, 인덱스벤처스 등 기존 투자자가 후속 투자에 나섰으며 쿼드릴캐피탈과 레드불벤처스가 새로 합류했다.

트웰브랩스의 출발점은 역발상이었다. 이재성 대표는 "5년 전 우리는 기계 지능의 기반이 언어가 아니라 움직이는 현실, 즉 영상에 있다는 확신으로 남들이 가지 않은 길을 택했다"며 "언어는 인간이 본 현실을 나중에 압축해둔 결과물일 뿐이고, 결국 AI가 진짜 답해야 하는 데이터는 영상"이라고 말했다.

회사 측에 따르면 전 세계 데이터의 90% 이상이 영상 형태로 존재하지만 대부분 검색·분석이 어려워 제대로 활용되지 못하고 있다. 트웰브랩스는 이 틈을 파고들었다. 영상 속 시각 정보·음성·언어·움직임을 시간 흐름에 따라 한꺼번에 처리하는 임베딩 모델 '마렝고 3.0'과, 인식 결과를 구조화된 지식으로 전환하는 '페가수스 1.5'가 핵심 무기다.

성과는 숫자로 증명됐다. 한국 AI 모델 최초로 아마존 베드록에 탑재됐고, CB 인사이트 'AI 100'에 4년 연속 선정됐다. 미디어·엔터테인먼트를 넘어 최근에는 전 세계 정부 기관과 협력하며 공공 부문으로 영역을 넓히고 있고, 광고·보안·스포츠·자동차 산업에서도 도입이 잇따르고 있다는 게 회사 측 설명이다.

아마존은 단순 투자를 넘어 전략적 파트너로 나섰다. 트웰브랩스는 아마존웹서비스(AWS)를 최우선 클라우드 제공자로 선정하고, AWS 자체 개발 AI 칩 '트레이니엄'에서 영상 추론이 효율적으로 작동하도록 최적화하기로 했다. 앞으로 출시할 영상 파운데이션 모델도 AWS에서 가장 먼저 공개한다.

[서울=뉴시스] 트웰브랩스가 지난 2월 공개한 영상언어 생성 모델 '페가수스-1.2'. 2025.06.08. (사진=트웰브랩스 제공) *재판매 및 DB 금지

네이버벤처스와의 인연도 각별하다. 박용정 네이버벤처스 D2SF 북미 투자 총괄은 "트웰브랩스는 네이버벤처스가 처음으로 투자한 기업이었으며, 이번 시리즈B 공동 주도는 우리가 보낼 수 있는 가장 강한 확신의 표현"이라며 "이재성 대표를 처음 만났을 때, 그는 트웰브랩스를 '미래 AI 에이전트의 시각 피질(visual cortex)'이라 표현했다. 그 비전은 시간이 지날수록 더욱 선명해졌다"고 말했다.

티파니 럭 NEA 파트너는 "이재성 대표와 그의 팀은 업계 기준을 새로 세운 파운데이션 모델을 구축했다”며 “수백만 시간의 영상을 시간이 지날수록 깊어지는 지능으로 전환할 수 있는 유일한 아키텍처를 갖추고 있다"고 높게 평가했다.

트웰브랩스는 확보한 자금으로 인식·기억·추론을 하나의 아키텍처로 통합한 '영상 인지 시스템' 구축에 나선다. 기존 거대언어모델(LLM)이 영상 분석 시 일부 프레임만 추출해 맥락을 놓치거나 질문 때마다 영상을 처음부터 다시 분석해야 했다면, 트웰브랩스의 새 아키텍처는 영상을 한 번 이해한 뒤 그 결과를 구조화된 기억으로 쌓아 두고, 이후 질문에는 축적된 기억을 토대로 추론한다. 쓸수록 똑똑해지는 구조다.

샌프란시스코와 서울에 이어 뉴욕·런던에 신규 사무소를 마련하고 로스앤젤레스(LA)를 포함한 글로벌 운영망도 넓힌다. 지난달에는 첫 애플리케이션 제품인 AI 영상 창작 도구 '로데오'의 클로즈드 베타 서비스도 시작했다.

이 대표는 "파운데이션 모델은 결국 누구나 쓰는 범용재가 되거나 더 나은 모델로 대체된다. 하지만 이를 유기적으로 통합하는 지능 레이어는 대체 불가능하다"며 "비디오 슈퍼인텔리전스 시대를 열겠다"고 강조했다.

◎공감언론 뉴시스 [email protected]