• 페이스북
  • 트위터
  • 유튜브

[강연]빅 데이터, 빅 임팩트-김화종 강원대 컴퓨터정보통신공학부 교수

등록 2012.12.08 16:42:03수정 2016.12.28 01:40:24

  • 이메일 보내기
  • 프린터
  • PDF
 빅 데이터 발전 위해 개인정보 보호는 필수

【서울=뉴시스】KAIST는 7일 한국과학기술회관 국제회의장에서 '제 1회 빅 데이터와 지식서비스 워크숍'을 개최했다.

 이날 워크숍에서는 김화종 강원대 컴퓨터정보통신공학부 교수가 '빅 데이터(Big Data), 빅 임팩트(Big Impact)', 이의진 KAIST 지식서비스공학과 교수가 '소셜 컴퓨팅을 위한 데이터 애널리틱스 및 데이터 수집', 이재길 KAIST 지식서비스공학과 교수가 '소셜 네트워크 빅 데이터 분석 기법', 이문용 KAIST 지식서비스공학과 교수가 '빅 데이터와 경영혁신'을 주제로 강연을 했다.

 빅 데이터란 소셜네트워크서비스(SNS) 및 스마트폰 등의 대중화로 다양한 형태의 데이터가 엄청나게 빠른 속도로 대량으로 생산되는 것을 가리킨다. 에릭 슈미트 구글 CEO는 "인류 문명이 시작된 이래 지난 2003년까지 만들어진 데이터 양은 모두 5엑사바이트에 불과했지만 지금은 이틀마다 그 정도 분량의 데이터가 새로이 추가되고 있으며, 이 속도는 점점 빨라지고 있다"고 말했다. 미국 의회 도서관이 소장한 장서는 약 1억5,000만종으로 1엑사바이트의 10만분의 1수준에 불과하다. 현재 전세계적으로 생산되고 있는 데이터의 양이 그만큼 엄청나다는 얘기다. 주요 강연 내용을 요약, 정리했다.

<빅 데이터(Big Data), 빅 임팩트(Big Impact)>-김화종 강원대 컴퓨터정보통신공학부 교수
 빅 데이터란 데이터를 통해 통찰력(insight)을 얻고 새로운 서비스를 제공하는 것이라고 할 수 있다. 빅 데이터는 광고, 마케팅, 의료, 금융, 재난관리 및 범죄예방 등 모든 분야를 혁신시킬 수 있다.

 지금은 컴퓨터를 비롯한 각종 정보커뮤니케이션기술(ICT)을 통해 자동적으로 엄청난 분량의 데이터가 발생한다. 이런 빅 데이터를 잘 할용할 수 있는지 여부가 기업의 경쟁력을 가름하게 된다.

 데이터가 늘어날 수록 적절한 데이터를 찾는 것은 더욱 어려워진다. 그래서 빅 데이터 분석 시간 가운데 70~80%는 데이터를 준비하는 데 사용된다.

 빅 데이터가 증가함에 따라 개인정보 문제가 불거질 수 밖에 없다. 우리는 알게 모르게 너무나 많은 정보를 흘리고 다닌다. 이런 과정에서 개인정보 노출 가능성도 높아진다. 유럽의 경우 개인정보를 '기본권'으로 인식해 보호의 대상으로 간주하려는 경향이 짙다. 반면 미국은 개인정보를 경제적 가치를 지닌 자원으로 여긴다.

 유통업체인 타겟은 지난 2012년 고객으로부터 거센 항의를 받았다. 타겟이 고등학생인 딸에게 유아용품 할인 쿠폰을 보냈기 때문이다. 타겟의 매니저는 "예비 엄마에게 보내야 할 쿠폰을 잘못 보냈다"며 정중히 사과했다. 그러나 여고생은 임신중이었다. 타켓은 그 여고생이 임신했다는 것을 어떻게 알고 유아용품 할인 쿠폰을 보냈을까. 이는 빅 데이터 활용의 승리였다. 타겟은 고객의 구매 패턴을 꼼꼼히 분석한다. 여성이 임신하면 초기에는 영양제, 중기에는 로션(lotion), 말기에는 유아용품을 주로 구매한다는 통계 분석 결과를 확보했다. 여고생이 영양제를 구입한 후 얼마 지나지 않아 로션을 구매하자 출산시점이 머지 않았다는 판단 아래 유아용품 할인 쿠폰을 보낸 것이다.

 빅 데이터와 프라이버시 문제는 상충되는 게 아니라 동반 관계라고 할 수 있다. 고속도로가 안전해야 자동차가 빨리 달릴 수 있듯이 프라이버시에 대한 우려를 불식해야 빅 데이터의 발전도 가능하다.

 프라이버시 정보는 아주 중요하고, 민감한 자산인 만큼 이를 안전하게 관리하는 게 새로운 비즈니스로 떠오를 것으로 전망된다. 아울러 고객은 자신의 개인정보를 이용하는 서비스 제공자를 자유롭게 바꿀 수 있어야 한다.

 엄청난 분량의 데이터가 시시각각 쏟아지는 만큼 이를 실시간으로 분석하고, 공유해야 할 필요성도 높아진다. 기업은 고객이 웹을 보는 도중에 마케팅을 펼쳐야 하고, 콜센터에 전화할 때도 고객의 수요를 분석한 후 마케팅에 활용하기 때문이다.

데이터 공유는 여러 가지 장점을 갖고 있다. 우선 데이터 수집 및 분석을 위한 중복 투자를 막을 수 있고, 투명성과 속도를 높이고, 규모를 확대할 수 있다. 또 필요에 따라 데이터를 약간 수정한 후 이름을 바꿔 활용함에 따라 불필요하게 데이터 사본이 늘어나는 것을 막을 수도 있다. 데이터 공유를 통해 기관과 기업은 성공적인 협력모델을 발굴할 수 있다.   

많이 본 기사

구독
구독
기사제보