본문 바로가기

추천 검색어

실시간 인기 검색어


여론조사에서 무응답 대체를 통한 선거 결과 예측

이용수 13

Predicting Election Results through Non-Response Substitution in Polls
권민수(MinSoo Kwon) 성진용(JinYong Sung) 최승배(Seung Bae Choi) 강창완(Changwan Kang)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.26 No.4, 1005~1013쪽, 전체 9쪽
자연과학 > 통계학

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

선거 여론조사를 통해 나타나는 결과에서 후보들의 지지율은 국민의 주요 관심사일 뿐만 아니라 해당 정당의 선거 전략 수립을 위해 중요한 요소로 작용한다. 그러나 선거 여론조사의 부정확하거나 왜곡된 결과가 나오면 그 영향력 때문에 큰 문제를 일으킬 수 있어 여론조사에 관한 논란이 자주 발생한다. 여론조사 예측 결과들이 실제 선거 결과와 다른 사례들이 다수 나타남에 따라 여론조사 관련 기관인 정당이나 조사기관 등에서 선거 예측의 정확성 제고를 위해 노력하고 있다. 본 연구에서는 제20대 대통령 선거, 2021년 부산시장 보궐선거, 제8회 전국동시지방선거(부산광역시 남구, 김해시장) 여론조사 데이터를 사용하여 머신러닝(Machine Learning) 알고리즘을 통해 무응답을 대체하여 선거 예측의 정확성을 높이고자 한다. 이를 위해서 첫째, 선거여론조사 문항 중 후보 선택 문항에서 무응답(모르겠다/없다)을 제외한 데이터를 훈련용 데이터(train data)로, 무응답(모르겠다/없다)을 선택한 데이터는 검증용 데이터(test data)로 데이터분할을 하였다. 둘째, 머신러닝 기법인 Random Forest, XGBoost, LightGBM 방법을 적용하였으며 훈련용 데이터를 통해 후보 예측 시 문항 중요도를 도출하여 상위 3개의 문항울 선택하였다. 셋째, 훈련용 데이터를 기반으로 학습된 모델을 통해 검증용 데이터의 무응답을 한 명의 후보를 선택한 응답으로 예측, 대체하여 해당 데이터와 훈련용 데이터를 합쳐 후보별 득표율을 산출하였다. 무응답을 대체하여 후보별 득표율과 실제 선거 결과를 비교한 결과 Random Forest 방법이 무응답 대체를 통한 선거 예측의 정확성 제고를 위한 모델로 적합한 것으로 확인하였다.

영문 초록

In the results of the election polls, the candidates' approval ratings are not only a major concern of the people, but also an important factor in establishing the election strategy of the party concerned. However, if there is an inaccurate or distorted result of the election poll, it can cause a big problem because of its influence, and the controversy about the poll often arises. There are many cases in which the actual election results are different from the results of the polls, and political parties and research institutes, which are related to the polls, are making efforts to improve the accuracy of the election forecasts. The purpose of this study is to improve the accuracy of election prediction by replacing non-response through machine learning algorithm using the survey data of the 20th Presidential Election, the 2021 Busan Mayor By-election, and the 8th National Simultaneous Local Election (Busan Metropolitan City, Nam-gu, Gimhae Mayor). For this purpose, first, the data excluding the non-response (I do not know/don't know) was separated into train data and the data selected as non-response (I do not know/don't know) was separated into test data. Second, Random Forest, XGBoost, and LightGBM methods were applied, and only the top three questions were used by deriving the importance of questions when predicting candidates through train data. Third, through the model learned based on the train data, the non-response of the test data was replaced with the response of one candidate, and the corresponding data and the train data were combined to calculate the percentage of votes for each candidate. As a result of comparing the actual election results with the percentage of votes for each candidate by replacing the non-response, it was confirmed that the Random Forest method is suitable for the model for improving the accuracy of election prediction through non-response substitution.


1. 서론
2. 무응답 대체를 위한 머신러닝 모델
3. 데이터 분석
4. 결론


해당간행물 수록 논문


교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원

권민수(MinSoo Kwon),성진용(JinYong Sung),최승배(Seung Bae Choi),강창완(Changwan Kang). (2024).여론조사에서 무응답 대체를 통한 선거 결과 예측. Journal of The Korean Data Analysis Society (JKDAS), 26 (4), 1005-1013


권민수(MinSoo Kwon),성진용(JinYong Sung),최승배(Seung Bae Choi),강창완(Changwan Kang). "여론조사에서 무응답 대체를 통한 선거 결과 예측." Journal of The Korean Data Analysis Society (JKDAS), 26.4(2024): 1005-1013

e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제