학술논문
측정오차로 인한 불완전한 측정 하에서의 결측값 대체
이용수 88
- 영문명
- Imputation of Missing Values with Incomplete Measurements due to Measurement Errors
- 발행기관
- 한국자료분석학회
- 저자명
- 송주원(Juwon Song)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.5, 2065~2075쪽, 전체 11쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2021.10.30
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
실제 자료는 여러 가지 원인으로 인하여 결측이 종종 발생하는데 결측값을 잘 예측할 수 있는 정보가 존재한다면 이를 활용하여 대체를 실시하는 게 바람직하다. 대규모 설문조사에서는 동일하거나 유사한 내용을 조사하는 여러 문항들이 사용되는 경우가 있고 동일한 정보를 측정한 행정자료나 다른 조사가 존재하기도 한다. 동일한 정보를 얻은 자료가 존재할 때 결측값 대체에서는 단순히 이 자료의 값으로 대체를 실시하는 게 일반적이지만 실제로 두 값은 정확히 동일하지 않은 경우가 많다. 본 연구에서는 결측이 발생한 관심 변수와 동일한 내용을 측정한 변수의 값이 일치하지 않는 경우 이를 측정오차를 포함한 관심변수의 불완전한 측정값이라 가정하고 이를 보정하는 대체 방법을 제안한다. 예제로 노동패널조사 22차 자료의 개인 작년 총근로소득에 결측이 발생하는 경우 작년에 응답한 월평균 근로소득으로부터 유추한 총근로소득으로 대체하는데 이 두 값들 사이에 차이가 존재하는 지 살펴보고 유추한 총근로소득을 조사에서 응답한 총근로소득에 대한 측정오차로 인한 불완전한 측정이라는 가정 하에 측정오차 모형을 사용해 보정하여 대체하였다. 모의실험을 통해 유추한 값으로 단순히 대체하는 경우와 측정오차를 고려한 보정을 실시하여 대체하는 경우를 비교하였는데 측정오차를 보정한 경우 평균 추정량의 편향이 더 작아지고 각 결측값을 더 정확히 대체하는 것으로 나타났다.
영문 초록
Real data often include missing values. When there exists information that can well predict missing values, it is recommended to conduct imputation using this information. In large scale surveys, there may be multiple questions that measure the same concepts. Under this circumstance, it is usual to impute missing values with this information. However, in reality, the variable to be imputed may not exactly match with information given by other variable or other resources. In this study, it is assumed that information from other variables or resources is incomplete measurement of the variable to be imputed due to measurement errors, and we suggest an imputation technique under the measurement error model. As an example, annual incomes of the last year in 22nd wave KLIPS data are compared with the predicted annual income using monthly income and the duration of jobs from the job history data. Differences between two values are observed, and Imputation was conducted with an adjustment of measurement errors when the predicted values are considered as values with measurement errors. Simulation was conducted to evaluate bias in the mean estimate and RMSE in the individual imputed values. It showed that imputation under the measurement error model performed better than naive imputation of the predicted values.
목차
1. 서론
2. 측정오차 모형을 고려한 무응답 대체
3. 노동패널조사 자료의 측정오차 모형
4. 모의실험
5. 노동패널조사의 대체
6. 결론 및 토의
References
해당간행물 수록 논문
- 인스타그램의 해시태그 및 위치 데이터를 이용한 클라이밍 활성화 실증분석
- Effects of Flipped Learning with a Team Project in Nursing Undergraduates
- 편의 보정 비모수 추정 기법을 이용한 에너지 수요 예측
- 측정오차로 인한 불완전한 측정 하에서의 결측값 대체
- Testing for House Price Bubble in Seoul, Korea
- 서울 아파트 매매가격 움직임의 효율성 비교분석
- A Statistical Generation Method of Association Rules by Inference of Diagnostic Test Index in Data Mining
- EDF를 이용한 국내산업 간 신용리스크 전이량 측정방안
- 대학생 핵심역량 진단 척도 개발 및 타당성 연구: D 대학을 중심으로
- 김해지역 신도시 공동주택 주차장 이용실태 비교연구
- 복수학위 네트워크와 전공융합의 구조
- 대사증후군 위험 사무직 근로자를 위한 생활습관개선 코칭프로그램의 효과
- 간병 형태와 간호사 태도가 병원 입원환자 만족도에 미치는 영향
- 간호대학생의 학습유형, 시각화 경향성, 문제해결과정과의 관계
- 주거환경이 지속거주의사에 미치는 영향 분석
- 연구개발비 투자 정보의 질과 주식가치 간의 관계
- 투자위험관리 방안에 대한 연구
- 주 52시간 상한제 도입 효과 분석
- 스마트시티 조성의 문제해결을 위한 프레임 분석
- 공동주택 주민의 자동심장충격기와 심폐소생술에 대한 인식과 태도 및 교육형태
- 도로 유형과 운전자 연령대에 따른 운전 시뮬레이터 멀미 차이
- 겨울철 도로기상 및 노면온도의 시·공간 변화 특성에 관한 연구
- 물류 네트워크 확보를 위한 국외 항만 선정 정보시스템 개발과 활용에 관한 연구
- 다양한 대응분석을 활용한 농업인의 업무상 질병 관계 연구
- 한국 성인 여성의 비만과 대사증후군의 연관성
- 경제정책의 불확실성과 은행의 대손충당금 적립 행위
- 저서성 대형무척추동물의 서식에 의한 대한민국 합천군 안금천의 수질 평가
- 라이브 커머스 플랫폼의 행위지원성과 원천 특성이 지각된 쇼핑 가치와 구매의도에 미치는 영향
- 제시방법, 필러 유사성, 연령의 삼원 상호작용을 바탕으로 한 라인업 정확성 분석
- 점심 회복활동이 직무열의를 통해 조직시민행동으로 가는 매개모형 연구
- 분기이익 품질의 차별성에 관한 연구
- 내부 기업지배구조가 재무곤경위험에 미치는 영향
- 계획된 행동 이론을 활용한 창원시 불법 주차의식 구조분석
- 2단계 집락추출법에 의한 혼합 승법 양적속성 확률화응답모형
- 주민 주거만족도 차이 검증에 따른 주택정책 방향
- Machine Learning Techniques with Item Response Data
- Journal of The Korean Data Analysis Society Vol.23 No.5 목차
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!