본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

텍스트 마이닝을 이용한 “조 바이든(Joe Biden)”을 다루는 미국 언론 보도 연구

이용수 181

영문명
A Study on USA Press Cover Joe Biden” Using Text Mining Analysis
발행기관
한국자료분석학회
저자명
이연동(Yeondong Lee) 박현주(Hyeonju Park) 조영석(Youngseuk Cho)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.2, 611~623쪽, 전체 13쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2021.04.30
4,360

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 연구의 목적은 미국 대통령 선거에서 당선된 “조 바이든(Joseph Robinette Biden)”이 현지 언론에서 어떻게 보도되고 있는지를 살펴보는 것에 있다. 분석할 데이터는 친 민주당(진보)성향인 “워싱턴 포스트(Washington Post, WP)”와 다른 곳은 미국 신문사 중에서 비교적 친 공화당(보수적)성향인 “월스트리트 저널(Wall Street Journal, WSJ)”의 언론사의 사이트에서 “Biden”을 검색하여 나오는 기사에서 제목만을 수집하였다. 기사본문은 언론사 정기구독을 해야 열람이 가능하기에 불가피하게 이번 연구에서 제외하였다. 수집한 데이터는 크게 2가지 방법으로 분석하였다. 첫 번째 방법은 잠재적 디리클레 할당(Latent Dirichlet Allocation, LDA)에 기반한 주제 모형(topic model)로 언론사 별로 최적의 주제 개수를 찾아 이를 구성하는 단어를 해석하여 언론에서 어떤 주제를 위주로 “조 바이든”에 대해 다루는지 살펴보았다. 두 번째 방법은 비교 양적 분석(quantitative analysis comparison)으로 정서 점수(polarity score), 가장 긍정적-부정적 문장 찾기(most positive-negative sentence), 다양성(diversity), 분산성(dispersion)기법 등 총 4가지 분석 기법을 사용하였다. 종합적으로 결론을 내리자면 WP는 LDA로 만족할 만한 주제를 추출 하였으나, WSJ는 데이터의 크기가 비교적 작은 탓인지 결과가 명확하지 않아 해석이 어려웠다. 또한 친 민주적인 성향인 WP가 WSJ에 비해 “조 바이든”에 대해 우호적으로 보도하였으며, 이는 정서 점수 분석으로 확인 할 수 있었다.

영문 초록

The purpose of this study is to examine how “Joseph Robinette Biden”, who elected for President of the United States. We collected the data to be analyzed from the pro-Democratic(progressive) propensity of the “Washington Post(WP)” and relatively pro-Republican(conservative) propensity the press of the “Wall Street Journal(WSJ)”. We searched for “Biden” on the site and collected only the title from the articles. Unfortunately, the body of the article was inevitably excluded from this study, as it was only possible to read the article by subscribing to the each press. We analyzed the collected data in two ways. The first way was a Topic Model based on Latent Dirichlet Allocation(LDA) which finds the optimal number of topics for each press and interprets the words that constitute them. So we looked to see if it was dealt with. The second way Quantitative Analysis Comparison using a total of 4 techniques, including Polarity Score, finding the most positive-negative sentences, Diversity, and Dispersion analysis. We can concluded comprehensively that in WP case was extracted satisfactory topics with LDA, but WSJ case couldn t be interpreted , the results were not clear. We can guess that this is due to the small size of data or fail to estimate the number of topics. In addition, the pro-democratic press WP reported favorably on Joe Biden compared to WSJ. This result could be assumed the main cause of polarity score analysis result.

목차

1. 서론
2. 데이터 설명
3. 데이터 전처리(data preprocessing)
4. 데이터 조감
5. 주제 모형(topic model)
6. 비교 양적 분석
7. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이연동(Yeondong Lee),박현주(Hyeonju Park),조영석(Youngseuk Cho). (2021).텍스트 마이닝을 이용한 “조 바이든(Joe Biden)”을 다루는 미국 언론 보도 연구. Journal of The Korean Data Analysis Society (JKDAS), 23 (2), 611-623

MLA

이연동(Yeondong Lee),박현주(Hyeonju Park),조영석(Youngseuk Cho). "텍스트 마이닝을 이용한 “조 바이든(Joe Biden)”을 다루는 미국 언론 보도 연구." Journal of The Korean Data Analysis Society (JKDAS), 23.2(2021): 611-623

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제