• 페이스북
  • 트위터
  • 유튜브

생성형 인공지능 신뢰도 식품안전 수준으로 높인다

등록 2023.12.01 10:22:41수정 2023.12.01 11:35:31

  • 이메일 보내기
  • 프린터
  • PDF

미 기업들 콘소시엄 D&TA "환각 현상" 등 오류 막는

인공 지능 학습 자료의 출처·이력·합법성 등 기준 제시

재료·생산·유통 투명성 보장하는 식품 안전 기준과 비슷

[보스턴=AP/뉴시스]사진은 챗GPT 개발사인 오픈AI 로고. 2023.12.01.

[보스턴=AP/뉴시스]사진은 챗GPT 개발사인 오픈AI 로고. 2023.12.01.


[서울=뉴시스] 강영진 기자 = 생성형 인공지능은 학습과정에서 스스로 생성한 자료도 포함해 학습한다. 이 때문에 인공지능이 생성한 결과물의 신뢰도가 떨어지는 일이 자주 발생한다. 특히 인공지능이 어떤 자료로 학습을 하는지를 사전에 알 수 없다는 점은 더 큰 문제가 된다.

이에 따라 미 대기업들과 스타트업 기업들로 구성된 비영리 연합단체가 인공지능이 학습하는 자료의 출처, 이력, 불법성 여부에 대한 기준을 세웠다고 미 뉴욕타임스(NYT)가 30일(현지시간) 보도했다.

아메리칸 익스프레스, 휴마나, IBM, 화이자, UPS, 월마트 등 대기업과 일부 스타트업 기업 등 24개 기업으로 구성된 비영리 콘소시엄 데이터 앤드 트러스트 연합(Data & Trust Alliance; D&TA)이 데이터 출처 기준(data provenance standards)을 만들어 발표했다.

이 단체는 인공지능이 학습할 수 있도록 허용되는 데이터 지정 방식이 식품의 출처와 생산자 및 유통 과정에 대한 기본 정보를 요구하는 식품안전 기준과 유사한 것으로 간주한다.

인공지능이 사용하는 자료가 보다 투명하게 공개되면 인공지능의 신뢰도가 높아질 수 있다는 것이다.

UPS사 정보기술 및 데이터 분석부문 켄 핀너티 사장은 “데이터를 자산으로 관리하기 위한 조치”라면서 “자산으로 관리하려면 데이터가 생성되는 과정과 상황, 의도, 합법성 여부를 알 수 있어야 한다”고 밝혔다.

미 기업 임원들 과반수가 인공지능을 경영에 도입하는 가장 큰 장벽이 “데이터의 연원과 출처에 대한 우려”라는 조사 결과가 있다. 또 데이터 과학자들이 작업 시간의 40%를 데이터를 정비하는데 사용한다는 조사 결과도 있다.

D&TA가 제시한 기준은 업무용 자료에 집중돼 있다. 기업들은 과거 인공지능 프로그램을 생산량을 조절하거나 제트 엔진 보수 시점을 예측하는 등의 용도로 사용해 왔다.

그러나 오픈AI의 챗GPT 등 생성형 인공지능이 등장하면서 데이터 사용 및 오용 문제가 제기돼 왔다. 생성형 인공지능은 인간 수준의 문장과 컴퓨터 코드를 만들어내기도 하지만 학습하는 자료에 의해 “환각”에 빠지는 일도 잦다.

이에 따라 기업들은 직원들이 챗봇을 업무에 사용하는 제한하고 일부 업무에 시험적으로만 적용하고 있다.

D&TA가 제시한 기준은 이력, 출처, 합법성여부, 데이터 형태, 생성 방법 등 8가지며 추가로 데이터가 소셜 미디어에서 나온 것인지 아니면 산업적 계측 자료인지도 표시하도록 돼 있다.

롭 토마스 IBM 소프트웨어 담당 선임 부사장은 “출처 불명의 자료는 자료가 아니다”라고 말했다.

D&TA는 기준을 개선해 내년 초 일반에 공개할 예정이다.


◎공감언론 뉴시스 yjkang1@newsis.com

많이 본 기사