본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

결측자료 분석에서 결측 비율이 결측자료 k-평균 군집분석에 미치는 영향

이용수 44

영문명
The Effect of Nonresponse Rates on K-Means Cluster Analysis with Missing Data
발행기관
한국자료분석학회
저자명
송주원(Juwon Song)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.19 No.3, 1273~1282쪽, 전체 10쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2017.06.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

결측자료의 분석에서 결측 비율은 분석의 질에 영향을 주는 주요 요소로 생각되어 왔다. 최근 결측 비율이 추정량의 편향에 영향을 주지 않는다는 연구 결과들이 발표되면서 결측 비율이 향상 분석의 질을 감소시키는 것은 아니라는 주장이 힘을 싣고 있다. 하지만 관련 연구들은 조사자료에서 결측이 발생한 경우 모집단 평균을 추정하는데 결측 비율이 영향을 주는지를 논의하고 있으며 다른 분석에서의 영향을 평가한 연구는 찾기 힘들다. 군집분석은 자료 내 유사한 특성을 지닌 개체들을 동일한 군집으로 분류하는 분석기법으로 군집의 평균 추정보다는 적절한 분류를 실시하지 못하는 정도에 중점을 두고 분석이 실시되므로 조사 연구에서 모평균 추정과는 다른 문제로 접근하는 것이 필요하다. 본 연구에서는 군집분석 기법 중 하나인 k-평균 군집분석에 대하여 대체를 실시한 후 k-평균 군집분석을 시행할 때 결측 비율이 어떤 영향을 미치는 지 고찰하였다. 특히 k-평균 군집분석의 성능 및 결측자료의 성능과 연관된 요인들인 군집 간 분포의 겹침 정도, 결측자료 메커니즘, 그리고, 결측자료 대체 방법에 따라 결측 비율이 증가할 때 군집분석의 오분류율이 증가하는지 모의실험을 통해 평가하였다. 군집 간 분포의 겹침 정도가 적은 경우 결측비율이 증가해도 오분류율은 비례적으로 증가하지 않는 것으로 나타났다.

영문 초록

In the analysis of missing data, nonresponse rates have been considered as an important factor to influence on the quality of the analysis, but recent empirical researches show that nonresponse rates are not related to bias of the estimates. These researches consider the effect of nonresponse rates in the estimation of the population mean in survey data, and it is hard to find researches to evaluate the effect of nonresponse rates on other types of analysis. Cluster analysis groups similar observations into the same cluster. Since the main interest of the cluster analysis is on the misclassification rates, not on the estimation of the cluster means, it is necessary to approach this problem differently. This research focuses on k-means cluster analysis when missing values are imputed and evaluates how nonresponse rates are related to misclassification rates. Especially, overlaps on distributions among clusters, missing data mechanisms, and imputation methods are considered as factors that may influence on the quality of the k-means clustering, and a simulation is conducted to evaluate the effect of these factors on the relationship between the nonresponse rates and misclassification rates. When distributions among clusters do not overlap, it shows that nonrespose rates are not related to misclassification rates.

목차

1. 서론
2. 결측자료 k-평균 군집분석의 오분류와 연관된 다른 요인들
3. 모의실험
4. 토의 및 결론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

송주원(Juwon Song). (2017).결측자료 분석에서 결측 비율이 결측자료 k-평균 군집분석에 미치는 영향. Journal of The Korean Data Analysis Society (JKDAS), 19 (3), 1273-1282

MLA

송주원(Juwon Song). "결측자료 분석에서 결측 비율이 결측자료 k-평균 군집분석에 미치는 영향." Journal of The Korean Data Analysis Society (JKDAS), 19.3(2017): 1273-1282

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제