본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

측정오차로 인한 불완전한 측정 하에서의 결측값 대체

이용수 83

영문명
Imputation of Missing Values with Incomplete Measurements due to Measurement Errors
발행기관
한국자료분석학회
저자명
송주원(Juwon Song)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.5, 2065~2075쪽, 전체 11쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2021.10.30
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

실제 자료는 여러 가지 원인으로 인하여 결측이 종종 발생하는데 결측값을 잘 예측할 수 있는 정보가 존재한다면 이를 활용하여 대체를 실시하는 게 바람직하다. 대규모 설문조사에서는 동일하거나 유사한 내용을 조사하는 여러 문항들이 사용되는 경우가 있고 동일한 정보를 측정한 행정자료나 다른 조사가 존재하기도 한다. 동일한 정보를 얻은 자료가 존재할 때 결측값 대체에서는 단순히 이 자료의 값으로 대체를 실시하는 게 일반적이지만 실제로 두 값은 정확히 동일하지 않은 경우가 많다. 본 연구에서는 결측이 발생한 관심 변수와 동일한 내용을 측정한 변수의 값이 일치하지 않는 경우 이를 측정오차를 포함한 관심변수의 불완전한 측정값이라 가정하고 이를 보정하는 대체 방법을 제안한다. 예제로 노동패널조사 22차 자료의 개인 작년 총근로소득에 결측이 발생하는 경우 작년에 응답한 월평균 근로소득으로부터 유추한 총근로소득으로 대체하는데 이 두 값들 사이에 차이가 존재하는 지 살펴보고 유추한 총근로소득을 조사에서 응답한 총근로소득에 대한 측정오차로 인한 불완전한 측정이라는 가정 하에 측정오차 모형을 사용해 보정하여 대체하였다. 모의실험을 통해 유추한 값으로 단순히 대체하는 경우와 측정오차를 고려한 보정을 실시하여 대체하는 경우를 비교하였는데 측정오차를 보정한 경우 평균 추정량의 편향이 더 작아지고 각 결측값을 더 정확히 대체하는 것으로 나타났다.

영문 초록

Real data often include missing values. When there exists information that can well predict missing values, it is recommended to conduct imputation using this information. In large scale surveys, there may be multiple questions that measure the same concepts. Under this circumstance, it is usual to impute missing values with this information. However, in reality, the variable to be imputed may not exactly match with information given by other variable or other resources. In this study, it is assumed that information from other variables or resources is incomplete measurement of the variable to be imputed due to measurement errors, and we suggest an imputation technique under the measurement error model. As an example, annual incomes of the last year in 22nd wave KLIPS data are compared with the predicted annual income using monthly income and the duration of jobs from the job history data. Differences between two values are observed, and Imputation was conducted with an adjustment of measurement errors when the predicted values are considered as values with measurement errors. Simulation was conducted to evaluate bias in the mean estimate and RMSE in the individual imputed values. It showed that imputation under the measurement error model performed better than naive imputation of the predicted values.

목차

1. 서론
2. 측정오차 모형을 고려한 무응답 대체
3. 노동패널조사 자료의 측정오차 모형
4. 모의실험
5. 노동패널조사의 대체
6. 결론 및 토의
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

송주원(Juwon Song). (2021).측정오차로 인한 불완전한 측정 하에서의 결측값 대체. Journal of The Korean Data Analysis Society (JKDAS), 23 (5), 2065-2075

MLA

송주원(Juwon Song). "측정오차로 인한 불완전한 측정 하에서의 결측값 대체." Journal of The Korean Data Analysis Society (JKDAS), 23.5(2021): 2065-2075

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제