• 페이스북
  • 트위터
  • 유튜브

머스크, MS에 소송 예고…"트위터 데이터 AI 훈련에 불법 사용"

등록 2023.04.20 16:40:45수정 2023.04.20 23:35:38

  • 이메일 보내기
  • 프린터
  • PDF
[보스턴=AP/뉴시스] 미국 보스턴에서 한 사용자가 컴퓨터로 인공지능(AI) 챗봇 '챗(Chat)GPT'를 사용하고 있다. 2023.04.20.

[보스턴=AP/뉴시스] 미국 보스턴에서 한 사용자가 컴퓨터로 인공지능(AI) 챗봇 '챗(Chat)GPT'를 사용하고 있다. 2023.04.20.


[서울=뉴시스] 이종희 기자 = 일론 머스크 테슬라 최고경영자(CEO)가 마이크로소프트(MS)가 인공지능(AI)을 언어모델을 훈련하기 위해 트위터의 데이터를 불법적으로 사용했다며 소송을 제기하겠다고 밝혔다.

19일(현지시간) CNBC에 따르면 머스크는 MS가 트위터 응용프로그램인터페이스(API) 비용을 지불하지 않고 자사 광고 플랫폼에서 트위터를 제외했다는 소식이 알려진 직후 이같이 밝혔다.

머스크는 트위터를 통해 "그들이 트위터 데이터를 사용해 불법적으로 훈련했다"며 "소송해야 할 때"라고 말했다.

앞서 정보기술(IT)매체 매셔블은 MS가 이날 자사의 마케팅 플랫폼에서 트위터를 제외했다고 보도했다.

MS는 '디지털 마켓팅 센터'(DMC)를 통해 인스타그램, 페이스북, 링크드인 등 여러 소셜미디어 계정을 관리하고 고객에게 메시지를 보내는 기능을 제공해왔다.

매셔블은 트위터가 이달 29일부터 기업 고객을 대상으로 API 유료화 정책을 시행하겠다고 밝히면서 MS가 대응에 나선 것으로 분석했다. 트위터는 무료로 제공했던 API 접근 권한에 대한 이용료로 월 4만2000달러(약 5600만원)를 부과할 예정이다.

CNBC는 "머스크가 실제 소송을 제기하지는 않은 것 같다"고 언급하면서도 이같은 조치가 AI 언어모델 훈련 과정에서 발생하는 데이터 소유권 논란을 잘 보여주는 사례라고 말했다.

CNBC는 "머스크의 고소 위협은 데이터 소유권이 생성형 AI 개발 경쟁의 우려스러운 전쟁터가 되고 있음을 보여주는 최근의 징후"라고 설명했다.

오픈AI의 챗GPT가 주목을 받으면서 빅테크 기업들이 생성 AI 개발에 몰두하고 있는 가운데 데이터 소유권자들이 언어모델 훈련에 사용되는 데이터에 대한 비용을 지불해야 한다고 주장하고 있다.

GPT와 같은 거대 언어모델(LLM)을 훈련시키기 위해서는 데이터가 필수적인데, 이를 온라인에서 수집하는 경우가 많다. 특히 트위터와 같은 소셜미디어의 데이터는 격식 없는 대화 내용이 담겨 있어 가치가 높은 것으로 알려졌다.

최근 실제 데이터를 소유하고 있는 회사들이 AI 개발사를 상대로 법적 대응에 나서는 경우도 늘어나고 있다. 

미국의 온라인 커뮤니티 레딧은 AI 개발 기업들이 자사의 데이터를 다운로드 하기 위해 API를 사용하면 비용을 청구할 계획이라고 밝혔다.

이미지 서비스 업체인 게티이미지는 AI 훈련을 위해 자사의 데이터를 무단으로 활용했다고 주장하며 스테이블 디퓨전을 개발한 스태빌리티 AI를 고소했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사