상세 컨텐츠

본문 제목

‘오피니언 마이닝’으로 여론을 들여다볼 수 있다?

디지털콘텐츠/이슈리포트

by 디지털콘텐츠기업 성장지원센터 2020. 10. 30. 17:36

본문

< 출처 : HIRINFOTECH, https://hirinfotech.com/opinion-mining >

 

코로나19 펜데믹으로 비대면 온라인 시장이 갈수록 각광받고 있다. 다양한 고객층의 주문 서비스에 대한 질 향상을 위하여 데이터 수집·분석 빅데이터 관리 기술이 발전하고 있다.

 

빅데이터 분석이란, 도처에 존재하는 다양한 성격의 빅데이터를 효과적으로 분석하는 것을 말한다. 빅데이터 시대에는 인터넷, 소셜 네트워크 서비스, 소셜 데이터(SNS 텍스트 데이터, 유튜브 비디오 데이터 등)와 같은 비정형 빅데이터를 분석하는 것이 무엇보다 중요해지고 있다. 빅데이터 분석을 위해서는 다양한 인공지능 기법이 적용돼야 하는데, 이 중에서 비정형 텍스트에 포함된 가치를 효과적으로 알아내는 '오피니언 마이닝(Opinion Mining)'이 최근 큰 주목을 받고 있다.

 

오피니언 마이닝(Opinion Mining)이란

오피니언 마이닝은 웹사이트와 소셜미디어에서 특정 주제에 대한 여론이나 정보(댓글, 게시글)수집·분석해 객관적 정보로 도출하는 빅데이터 처리 기술이다. 오피니언 마이닝은 감정 분석이라고도 불리는데, 웹 문서의 주제에 관한 객관적인 정보 뿐 아니라 나타난 감정 표현까지 분석할 수 있다는 점이 특징이다.

 

따라서 오피니언 마이닝을 활용하면 사람들이 특정 서비스 및 상품에 대해 긍정적인지 부정적인지를 분석할 수 있고, 더 나아가 그 원인까지 도출할 수 있다. 특히 정치나 경제, 또는 사회적으로 특정한 사안들이 발생했을 때, 여론이나 대중의 관심도가 실시간으로 어떻게 변하는지를 확인할 수 있다는 점이 강점이라고 할 수 있다.

 

 

< 출처 : PDI, https://pdi.fbk.eu/opinion-mining-and-sentiment-analysis >

 

오피니언 마이닝의 단계

우선 분석하고자하는 텍스트 문서를 수집한다. 대량의 텍스트가 저장되면, 주관성 탐지를 한다. 여기서 주관적이라고 하는 것은 긍정적 또는 부정적 의견을 포함하는 것으로 감성과 관련없는 부분은 제외한다.

그 다음 단계에서는 문장들을 분해하여 단어들을 도출하고, 단어들의 극성을 분석한다. 텍스트 안에 포함된 단어들이 긍정적인 단어인지, 부정을 표현하는 단어인지를 도출한다. 특히 온라인상 특정한 시기마다 유행하는 신조어가 다르기 때문에 이 과정에서 분석하려는 글의 핵심 어휘나 신조어들을 미리 정의하고 신속하게 업데이트하는 것이 중요하다.

마지막 단계는 단어들의 극성을 바탕으로 텍스트 극성을 탐지하는 단계이다. 일반적으로 텍스트에서 단어가 출현하는 빈도와 감성 점수의 가중치합으로 텍스트 전체의 극성을 분석하게 된다. 감성점수는 '긍정'1, '부정'-1점 점수를 부여하고, 단어 감성정도에 따라 -1점에서 1점 사이의 값을 부여하게 된다.

 

< 출처 : JOOINN, https://jooinn.com/team-work-business-meeting-top-view-with-copyspace.html >

 

오피니언 마이닝의 활용

오피니언 마이닝은 트렌드 파악, 제품/서비스 평가, 미래 예측 등에 활용된다.

우선 트렌드 파악은 사람들이 최근 이슈에 대해 어떻게 파악하는지 분석하는 것이다. 실제로 2012년 미 대선 오바마 캠프의 경우, 유권자들이 다양한 방식으로 작성한 텍스트를 분석해 유권자 개개인에게 최적화된 선거 전략을 만들어 내기도 했다. 이는 정치, 사회적 이슈 뿐만 아니라, 연예나 스포츠 등의 분야에서도 동일하게 적용될 수 있다.

제품/서비스 평가의 경우, 기업 매출에 직결되는 보다 직접적인 활용도를 가지고 있다. 특히 온라인 커뮤니티에는 제품 및 서비스 관련 평가 혹은 불만사항이 무수히 많이 올라와 있으며, 온라인몰에는 상품 구매에 대한 리뷰가 노출되어 있다. 고객이 부여하는 별점과 리뷰 내용이 일치하지 않는 경우도 많기 때문에 오피니언 마이닝은 별점에서 발견할 수 없는 시사점을 제시할 수 있다.

 

< 출처 : "쌍욕 바꾸고 지우고… AI, 한 달 1억건 걸러도 진화하는 악플", <한국일보>, 2020.10.08. >

 

인터넷이 발달하면서 댓글 문화가 만들어졌다. 그리고 늘어난 악플은 서비스 병폐화를 불러 일으켰다. 수많은 댓글 중에서 악플을 선별하는 것은 불가능하다. 그렇기 때문에 오피니언 마이닝으로 악플을 걸러내는 기술도 생겨났다. 악성 댓글 빅데이터를 기반으로 축약어와 오탈자가 많은 구어체 댓글 특성을 분석하고, 비속어가 없어도 문장 맥락을 고려해 모욕ㆍ혐오 표현이라고 판단되면 AI가 블라인드 처리하는 식이다.

 

이외에도 유사 집단 데이터 기반 음악 필터링을 통해 이용자에게 음악을 추천하는 기존 플랫폼 방식 대신 이용자의 댓글, 이모티콘 등 비정형 데이터를 기반으로 보다 세분화된 음악을 추천하는 서비스도 가능하다. 예를 들면, '비오는 가을 오후, 드라이브하면서 듣기 좋은 음악'과 같이 개인의 상황이나 감성에 적합한 음악을 골라주는 것이다. 맞춤형 음악 추천 서비스를 위해서는 오피니언 마이닝을 통한 장르별, 상황별 이용자 태그 클러스터 확보가 필요하다.

오피니언 마이닝을 이용하다 보면 모래알처럼 흩어져 있던 온라인 텍스트 데이터가 보다 가치 있는 정보로 변모하는 과정을 체험할 수 있다. 때문에 보다 예측 가능하고 정확한 전략을 수립할 수 있다.

온라인과 소셜미디어 여론 관리에 대한 중요성이 그 어느 때보다 부각되고 있는 요즘 상황에서 오피니언 마이닝 기법은 기업이나 단체의 의사결정에 있어 필수적인 솔루션이 될 것으로 전망되고 있다.

 

[출처]

- “광역상수도 스마트관리 시스템 도입”, <환경일보>, 2020.06.12.

- “브레인데크 "수요자 중심 공연메이킹 플랫폼 '티분' 개발"”, <SBS CNBC>, 2020.05.20.

- “비정형 빅데이터 분석, 기업 경쟁력 확보 지름길”, <데이터넷>, 2018.07.23.

- "소셜미디어 속 여론을 제대로 파악하는 방법?", <TheScienceTimes>, 2020.07.13.

- "쌍욕 바꾸고 지우고AI, 한 달 1억건 걸러도 진화하는 악플", <한국일보>, 2020.10.08.

- “인공지능을 활용한 오피니언 마이닝 - 소셜 오피니언 마이닝은 무엇인가?”, <SAMSUNG SDS>, 2017.05.10.

- "[총선이슈] 민주당 ‘180숨은 비결, ‘빅데이터 선거였다", <폴리뉴스>, 2020.04.22.

- "[46]"코비드19를 인공지능으로 격퇴해야"", <이데일리>, 2020.09.26.

- DAUM 백과, https://100.daum.net/encyclopedia/view/201XXX1907114

- HIRINFOTECH, https://hirinfotech.com/opinion-mining/

- JOOINN, https://jooinn.com/team-work-business-meeting-top-view-with-copyspace.html

- PDI, https://pdi.fbk.eu/opinion-mining-and-sentiment-analysis

 

관련글 더보기

댓글 영역