학술논문
텍스트 마이닝을 이용한 “조 바이든(Joe Biden)”을 다루는 미국 언론 보도 연구
이용수 181
- 영문명
- A Study on USA Press Cover Joe Biden” Using Text Mining Analysis
- 발행기관
- 한국자료분석학회
- 저자명
- 이연동(Yeondong Lee) 박현주(Hyeonju Park) 조영석(Youngseuk Cho)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.2, 611~623쪽, 전체 13쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2021.04.30
4,360원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구의 목적은 미국 대통령 선거에서 당선된 “조 바이든(Joseph Robinette Biden)”이 현지 언론에서 어떻게 보도되고 있는지를 살펴보는 것에 있다. 분석할 데이터는 친 민주당(진보)성향인 “워싱턴 포스트(Washington Post, WP)”와 다른 곳은 미국 신문사 중에서 비교적 친 공화당(보수적)성향인 “월스트리트 저널(Wall Street Journal, WSJ)”의 언론사의 사이트에서 “Biden”을 검색하여 나오는 기사에서 제목만을 수집하였다. 기사본문은 언론사 정기구독을 해야 열람이 가능하기에 불가피하게 이번 연구에서 제외하였다. 수집한 데이터는 크게 2가지 방법으로 분석하였다. 첫 번째 방법은 잠재적 디리클레 할당(Latent Dirichlet Allocation, LDA)에 기반한 주제 모형(topic model)로 언론사 별로 최적의 주제 개수를 찾아 이를 구성하는 단어를 해석하여 언론에서 어떤 주제를 위주로 “조 바이든”에 대해 다루는지 살펴보았다. 두 번째 방법은 비교 양적 분석(quantitative analysis comparison)으로 정서 점수(polarity score), 가장 긍정적-부정적 문장 찾기(most positive-negative sentence), 다양성(diversity), 분산성(dispersion)기법 등 총 4가지 분석 기법을 사용하였다. 종합적으로 결론을 내리자면 WP는 LDA로 만족할 만한 주제를 추출 하였으나, WSJ는 데이터의 크기가 비교적 작은 탓인지 결과가 명확하지 않아 해석이 어려웠다. 또한 친 민주적인 성향인 WP가 WSJ에 비해 “조 바이든”에 대해 우호적으로 보도하였으며, 이는 정서 점수 분석으로 확인 할 수 있었다.
영문 초록
The purpose of this study is to examine how “Joseph Robinette Biden”, who elected for President of the United States. We collected the data to be analyzed from the pro-Democratic(progressive) propensity of the “Washington Post(WP)” and relatively pro-Republican(conservative) propensity the press of the “Wall Street Journal(WSJ)”. We searched for “Biden” on the site and collected only the title from the articles. Unfortunately, the body of the article was inevitably excluded from this study, as it was only possible to read the article by subscribing to the each press. We analyzed the collected data in two ways. The first way was a Topic Model based on Latent Dirichlet Allocation(LDA) which finds the optimal number of topics for each press and interprets the words that constitute them. So we looked to see if it was dealt with. The second way Quantitative Analysis Comparison using a total of 4 techniques, including Polarity Score, finding the most positive-negative sentences, Diversity, and Dispersion analysis. We can concluded comprehensively that in WP case was extracted satisfactory topics with LDA, but WSJ case couldn t be interpreted , the results were not clear. We can guess that this is due to the small size of data or fail to estimate the number of topics. In addition, the pro-democratic press WP reported favorably on Joe Biden compared to WSJ. This result could be assumed the main cause of polarity score analysis result.
목차
1. 서론
2. 데이터 설명
3. 데이터 전처리(data preprocessing)
4. 데이터 조감
5. 주제 모형(topic model)
6. 비교 양적 분석
7. 결론
References
해당간행물 수록 논문
- Democratic Peace in the post-Cold War Era
- Ordered Multi-Category Logits Model Under Dirichlet Distribution
- 규제가설 입증을 위한 은행 위험대리변수의 적정성 연구
- 인구 변동과 지가 변동에 관한 연구
- Application of Data Fusion Technique for the Analysis of Medical and Healthcare Consciousness
- Auto-Kohesion 시스템의 언어적 측정치에 기반한 과학교과서 분석
- 창업이후 1인 창조기업의 생존율 변화 분석
- 데이터 3법 개정안 통과에 따른 주식시장 반응에 관한 연구
- Sellke Construction과 동적 생존 함수를 이용한 확률적 감염병 확산 모형 구축
- 공변량의 측정오차를 고려한 소지역 비율의 계층적 베이지안 추정
- 초고령 독거노인의 실버 놀이춤이 고독감과 심리적 안녕감에 미치는 영향
- 매개효과 분석에서 오차 간 상관을 고려한 경향점수 역확률가중치 활용방법
- 간호사 노동시장의 이중구조에 관한 실증 분석
- 제조업 분야 에너지절약시설 투자에 대한 에너지 절감효과 분석
- 단어 임베딩을 통한 고전 문학 감정 분석
- 다문화청소년의 학교생활 만족이 진로태도에 미치는 영향
- 텍스트 마이닝을 이용한 “조 바이든(Joe Biden)”을 다루는 미국 언론 보도 연구
- 단일판매공급계약 공시의 주가 반응
- 권리매도희망자와 권리매수희망자 구분에 따른 상가권리금 결정요인 연구
- 겨울철 도로 기상정보 생산을 위한 공간보간법 비교
- 도시재생 사업 활성화 수단으로의 청년 음식 창업 방안에 관한 연구
- 간호대학생의 자아탄력성, 사회적지지, 셀프리더십이 대학생활적응에 미치는 효과
- 스캐너 자료에서 거래량에 관한 가격 변화율 분산의 동질성 검정
- 보험소비자의 불만경험이 부정적 감정, 불평행동 및 부정적 구전의향에 미치는 영향
- 준비모수적 접근을 통한 중앙은행의 비대칭 선호도 측정
- 정규분포와 지수분포하에서 구조방정식모형의 주요 적합도 지수에 대한 제2종 오류 평가
- 전기/전자/IT산업에서 특허의 질적 특성에 대한 외국인 투자자 반응
- 수술실 간호사의 갈등관리 유형, 의사소통 능력 및 소진 간의 관계
- 기상 및 토양 데이터를 활용한 장단기 메모리 모형 비교
- 기업의 사회적 책임활동과 주식 유동성
- 싱가포르 소비자의 한국산 딸기 선호도와 과채류 수입상품 선호와의 관계
- 재무 및 건강 설문자료에서 결측치의 논리적 한계정보를 고려한 회귀모형 기반 베이지안 다중대체 방법의 적용
- 바이오 연료, 국제 원유, 농산물 가격의 상호관계
- 특수교사 대상 장애학생 성교육에 대한 인식 측정도구의 신뢰도 및 타당도 검증
- 제주삼다수의 지각된 가치가 경쟁우위인식을 통한 지역산업 브랜딩에 미치는 영향
- Estimation for the Half-triangle Distribution based on Generalized Adaptive Progressive Hybrid Censored Samples
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!