학술논문
머신러닝을 활용한 설문조사 불성실응답 판별
이용수 266
- 영문명
- False Responses Detection of Survey System using Machine Learning
- 발행기관
- 한국자료분석학회
- 저자명
- 권민수(MinSoo Kwon) 최승배(Seungbae Choi) 강창완(Changwan Kang)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.22 No.3, 1013~1021쪽, 전체 9쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2020.06.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
최근 많은 기업에서 적은 비용과 짧은 조사 기간으로 합리적이고 효율적인 조사를 가능하게 하는 서비스를 선호함에 따라 온라인 서베이 플랫폼 시장이 점차 활성화되고 있다. 그러나 온라인 조사의 단점인 낮은 데이터의 신뢰도는 극복하지 못하고 있는 실태이다. 본 연구에서의 목적은 인터넷 설문조사에서 불성실 응답자를 판별하는 방안을 제안하는 데 있다. 본 연구에서 제안하는 방법의 적용 가능성을 보이기 위해 간단한 시뮬레이션과 실제 적용사례를 수행하여 머신러닝 기법 중 ANN 모형과 SVM 모형을 고려하여 불성실 응답자의 판별 예측력을 비교해 본다. 실제 적용사례에서는 불성실 응답자를 판별할 수 있는 변수로서 응답소요시간, 응답시간, 성별, 연령, PC, Mobile, 부정응답횟수를 고려하였고, 본 연구에서 적용된 데이터는 부산광역시에 거주하고 있는 10대 이상의 거주자들을 대상으로 한 설문조사 데이터이다. 분석결과, 간단한 시뮬레이션에서는 ANN 모형과 SVM 모형은 별 차이를 보이지 않았다. 실제 적용사례에서는 참값을 모르기 때문에 예측력 측면에서 어느 모형이 좋고 나쁨을 논하기에는 문제가 있다. 따라서 차선책으로 두 모형의 결과와 주관식의 내용을 고려하여 판단했을 때, 테스트 데이터에서 SVM 모형이 ANN 모형보다 예측력의 측면에서 우수함을 보였다.
영문 초록
As an increasing number of businesses prefer services that enable them to conduct surveys on a reasonable and effective basis at lower costs and over a shorter period of time, online survey platform markets are growing. However, data reliability, one of the shortfalls in online survey, is yet to be addressed. The purpose of this study is to present the methods to identify unreliable respondents in online survey. In order to demonstrate the possible application of the method presented herein, we will run simple simulation and look into actual cases of application. And then we will compare judgement predictability by considering two machine learning methods: ANN model and SVM model. For the variant in identifying unreliable respondents, we took into account time taken to respond, responding time, gender, age, PC, mobile, and the number of false answers in the actual applications. The data applied in this study is the survey data on residents in their teens or older in Busan. The analysis found that the simple simulation did not demonstrate special difference between ANn model and SVM model. However, it is early to determine which model is better in terms of predictability since true values are unknown in actual application. Therefore, after considering the results from the two methods and the contents of subjective questions as an alternative, SVM model was better at predicting than ANN model.
목차
1. 서론
2. 연구 모형
3. 연구설계 및 분석
4. 연구결과
5. 결론
References
해당간행물 수록 논문
- 보고 오즈 비의 신뢰구간을 활용한 연관성 유무 판정 방안
- 머신러닝을 활용한 설문조사 불성실응답 판별
- 헷지 및 안전피난적 자산으로써의 암호화폐에 대한 연구
- 베이지안 시공간 모형을 이용한 한반도 오존농도 예측
- 가구 규모별 소비지출에 대한 분석
- 여자 프로 배구 V-리그의 시즌 승률 모형 구축
- 목표 및 실현가능 연금소득대체율 추정에 관한 연구
- 인지정보처리시 억제기제와 어휘성의 상호작용
- 연관성 평가를 위한 기여 순수 부호 헬링거 측도의 제안
- Rolling 회귀를 활용한 수도권 부동산 시장의 거품 추정
- 담배 소비의 가격탄력성 추정
- 텍스트 분석을 이용한 청원데이터의 주제 및 감성에 관한 연구
- 남성 독거노인의 영양장애 예측요인
- 가계의 자산선택 인식에 관한 연구
- 변동성전이지수를 이용한 한국금융시장의 전이효과에 관한 연구
- 십분위분배율을 이용한 정규성 검정
- 주성분 회귀에서 원변수의 신뢰구간 구축에 관한 연구
- 경제기반이론을 활용한 부산지역 일자리 성과 분석
- Using Body Mechanics, Fatigue and Work Satisfaction among Clinical Nurses
- Residual Maximum Drawdown in the Korean Stock Market
- Employment Dynamics by Different Firm Size in Korea
- COVID-19: A Parallel Multiple Mediation Model of Fan Identification, Social Media Engagement, and Stress
- 분노 및 슬픔이 정서적 섭식자의 주의편향 및 음식 섭취에 미치는 영향
- 유상증자와 기업의 불투명성
- Informational Content of Exchange Flows in Cryptocurrency Markets
- 지역 R&D 투자 현황 및 경제 성장 기여 분석
- 시계열 예측을 위한 인공신경망의 입력노드 수 결정
- 은행 대출과 영업 효율성간의 관련성 연구
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!