본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

LDA와 Word2vec 방법론을 이용한 의정부시 SNS 데이터의 토픽 모델링 및 시각화

이용수 415

영문명
Topic Modeling and Visualization of Uijeongbu City SNS data using LDA & Word2vec Methodology
발행기관
한국자료분석학회
저자명
서혜선(Hyesun Suh)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.22 No.6, 2391~2403쪽, 전체 13쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2020.12.30
4,360

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

토픽모델링의 대표적 방법인 LDA를 이용하여 지자체 ‘의정부시’ 키워드 기반의 소셜 텍스트 데이터에 대한 토픽모델링을 실시하고 각 토픽별 중심단어에 대한 단어간 유사도를 Word2vec의 Skip-gram 알고리즘을 이용해 산출하여 시각화 해 보고자 한다. 또한 선정된 토픽별 긍·부정어의 수준이 어떠한지를 파악하기 위해 감성분석을 실시한다. ‘의정부’ 관련 소셜데이터는 네이버와 다음의 카페, 블로그, 지식인, 웹문서를 대상으로 하였다. 토픽모델링 결과 ‘입시교육’, ‘이사/수리’, ‘웨딩’, ‘취미/레저’, ‘행정/기관’, ‘음식/맛집’ 이라는 6개의 토픽이 선정되었으며 각 토픽별 단어들의 유사도 시각화 결과를 제시하였다. 토픽별 감성분석 결과 ‘입시교육’에 있어서는 부정어와 중립단어들의 비율이 높은 반면 ‘음식/맛집’은 긍정어휘의 비율이 매우 높게 나타났음을 확인 할 수 있었다. 본 연구를 통해 경기북부를 포함한 많은 지자체들이 관심 키워드 중심의 소셜데이터 수집 및 분석을 통해 지자체와 관련한 주요 키워드들이 무엇이며, 주로 어떤 주제 또는 토픽에 관심을 가지고 있는지 등을 파악하고, 이러한 키워드 분석을 지자체 특성과 결합하여 지역행정의 방향에 도움을 줄 수 있는 인사이트를 찾을 수 있을 것이라 기대해본다.

영문 초록

Topic modeling is conducted on social media data of the local government Uijeongbu City using LDA, a representative method of topic modeling. The degree of similarity between words from the central words of each topic is calculated and visualized using the Skip-gram algorithm of Word2vec. Also this study conducts sentiment analysis for each selected topic. Uijeongbu social data was targeted at Naver and Daum cafes, blogs, intellectuals, and web documents. As a result of the topic modeling, six topics were selected: ‘entrance examination education’, ‘moving/repair’, ‘wedding’, ‘hobby/leisure’, ‘administration/institution’, and ‘food/restaurant’ and the results of visualization of the similarity of words for each topic were presented. As a result of the sentiment analysis for each topic, it was confirmed that the ratio of negative words and neutral words was high in ‘entrance examination education , while the ratio of positive vocabulary was very high in ’food/restaurant’. Through this study, local governments are expected to be interested in social data and collect and analyze it. Also, through this analysis, I hope that it will provide as an opportunity to recognize that social data has great value as information that can support local government administration.

목차

1. 서론
2. 이론적 배경 및 연구모형
3. 실증 분석
4. 결론
Reference

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

서혜선(Hyesun Suh). (2020).LDA와 Word2vec 방법론을 이용한 의정부시 SNS 데이터의 토픽 모델링 및 시각화. Journal of The Korean Data Analysis Society (JKDAS), 22 (6), 2391-2403

MLA

서혜선(Hyesun Suh). "LDA와 Word2vec 방법론을 이용한 의정부시 SNS 데이터의 토픽 모델링 및 시각화." Journal of The Korean Data Analysis Society (JKDAS), 22.6(2020): 2391-2403

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제