• 페이스북
  • 트위터
  • 유튜브

[빅데이터MSI②]온라인·SNS '시장 심리', 빅데이터로 '미분'한다

등록 2016.03.14 08:50:00수정 2016.12.28 16:44:51

  • 이메일 보내기
  • 프린터
  • PDF
【서울=뉴시스】

【서울=뉴시스】심동준 기자 = 온라인과 소셜네트워크서비스(SNS)에 오르내리는 다양한 문장은 여러 개의 단어로 구성돼 있다.

 뉴시스와 코스콤이 빅데이터 MSI(시장심리지수)를 도출하는 과정에서 사용하는 '형태소 분석'은 문장을 최소 단위까지 분해해 온라인 이면에 숨어 있는 시장 심리를 파악하는 방법론이다.

 우선 형태소 분석은 특정 사안에 대해 온라인에서 논의되는 문장을 형태소 수준으로 쪼개는 데서 시작한다.

 예컨대 트위터에 "그 회사 물건을 써 보니 참 좋았어요"란 글이 올라왔다면 '좋았어요'라는 단어를 근거로 긍정적 의견이라고 판단할 수 있다.

 반면 "거기 서비스 이용해 보니 참 별로였다"는 의견은 이용자가 해당 회사를 부정적인 눈으로 바라보고 있다는 점을 시사한다.

 특히 복잡한 글보다는 형용사를 통해 감정을 직접적으로 표현하는 경우가 많은 SNS를 분석 대상으로 두면 온라인상의 분위기를 파악하기가 한결 쉬워진다.

 기쁘다, 슬프다, 좋다, 싫다 등의 직접적 형용사 표현은 온라인에서의 심리를 조망하기 위한 좋은 질료가 된다.

 실제 분석을 위한 데이터는 트위터 같은 SNS는 물론 블로그와 카페, 포털사이트의 게시 글과 뉴스, 증권사 홈페이지 등 온라인 전반에서 수집된다.

 이렇게 형태소 분석을 통해 채집된 단어들은 '감성 사전'을 통해 계량된다.

  감성 사전은 수십만 개의 단어 데이터를 분석해 어떤 사안에 대해 긍정적, 부정적인 평가가 이뤄지고 있는지를 측정하는 일종의 자동화 시스템이다.

 이를 통해 감정을 나타내는 형용사 이외의 연관 단어들까지 포괄적으로 분석, 시장의 심리까지 가늠할 수 있다는 게 코스콤의 설명이다.

 이를테면 분석 대상이 삼성전자라고 하면, 글자 그대로의 '삼성전자' 이외에도 '삼전', 'S전자'와 같은 사실상 같은 대상을 가리키는 단어가 들어간 문맥을 확인한다.

 또 '갤럭시 노트', '갤럭시 기어' 등 서브 브랜드까지 포괄해 대상에 미칠 수 있는 심리적 영향을 분석하게 된다.

 분석은 코스피200과 코스닥50 종목 등 모두 250곳을 대상으로 이뤄진다.

 이들 종목에 대한 "좋다", "나쁘다"는 식의 감정 표현은 물론 "매출이 올랐다", "부채율이 상승했다" 등과 같은 시장 심리에 영향을 미칠 수 있는 내용에 점수를 부여하는 방식으로 진행된다.

 이렇게 수집된 정보는 한 시간 간격으로 형태소 분석과 감성 분석을 거쳐 시장 심리를 반영한 지표로 변환된다.

 온라인에서 기업과 주식, 시장을 바라보는 비정형의 심리가, 계량 가능한 정형화된 수치로 치환되는 셈이다.

 [email protected]

많이 본 기사