학술논문
결측자료의 k-평균 군집분석
이용수 69
- 영문명
- K-Means Cluster Analysis for Missing Data
- 발행기관
- 한국자료분석학회
- 저자명
- 송주원(Juwon Song)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.19 No.2, 689~697쪽, 전체 9쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2017.04.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
군집분석은 유사한 특성을 지닌 관측치들을 동일한 그룹으로 분류하는 분석 기법이다. k-평균군집분석은 관측치들과 군집 평균의 유클리디언 거리의 합을 최소화하는 그룹을 찾는 최적화 기법을 통해 자료를 군집으로 분류한다. 실제 자료의 경우 일부 변수에서 결측이 발생하는 경우가 흔하며 결측을 포함한 자료에 대하여 군집분석을 실시하는 경우 결측이 발생한 관측치를 제거한 후 분석을 실시하는 것이 일반적이다. 하지만 이 경우 결측이 발생한 자료는 어느 군집에도 할당할 수 없고 각 그룹의 평균의 추정에 편향이 발생할 가능성이 높다. 따라서 결측치를 포함한 자료를 군집분석에 포함하기 위하여 흔히 사용되는 방법은 결측값에 대해 대체를 실시한 후 대체된 자료에 대하여 군집분석을 실시하는데 이 경우 군집 정보를 포함하지 않고 대체를 실시하는 단점을 지닌다. 따라서 본 연구에서는 결측치에 대한 대체를 실시할 때 군집 정보를 이용하여 대체하는 방법을 제안한다. 모의실험을 통해 본 연구에서 제안한 방법을 군집 정보를 포함하지 않고 대체를 실시한 후 군집분석을 실시하는 경우와 비교하였는데 본 연구에서 제안한 대체방법이 더 나은 결과를 보였다.
영문 초록
Cluster analysis is an analysis technique to classify observations with similar characteristics into the same cluster. The k-means cluster analysis conducts grouping of observations based on an optimization method minimizing the sum of Euclidean distances between observations and their cluster centers. In real data, missing values often occur in some variables, and when cluster analysis is conducted for missing data, it is common to exclude observations with missing values. However, in this case, missing values cannot be classified into any group, and it may cause biases in estimating cluster centers. Therefore, to include observations with missing values in cluster analysis, it is often to impute missing values and conduct cluster analysis using imputed data. A disadvantage of this imputation approach is to conduct imputation without using cluster information. In this study, we propose methods to impute missing values using cluster information. Simulation is conducted to compare performance of the suggested imputation method with the one based on imputation without using cluster information. The proposed imputation method provides better results than the one ignoring cluster information.
목차
1. 서론
2. 결측자료에 대한 k-평균 군집분석
3. 모의실험
4. 토의 및 결론
해당간행물 수록 논문
- 청소년의 다문화 경험과 교사지지가 다문화 수용성에 미치는 영향 : 자기효능감의 매개효과를 중심으로
- 초등 3-4학년 아동의 문단글 읽기 정확성, 속도와 언어능력 간의 관계
- 외국인 유학생의 문화적응스트레스가 대학생활적응에 미치는 영향
- The Optimal Release Time using Software Reliability Model with a Burr Type III Fault Detection Rate Function
- A Study on Comparison of the Prediction Models for Lattice Spatial Data: Using Philippine Robbery and Murder Data
- 평생학습동기가 평생학습역량에 미치는 영향 분석: 임파워먼트의 매개효과를 중심으로
- 이변량 준연속형 비율자료 분석을 위한 회귀모형
- 자아고갈과 폭식수준이 충동행동에 미치는 영향
- 로열티 프로그램의 가치가 서비스 재이용의도에 미치는 영향
- 한국 남녀 노인의 근감소성 비만 영향 요인 분석: 제 5기 국민건강영양 조사 자료(2010-2011년) 활용
- 간호대학생의 문화적 역량 영향 요인
- SNS 매개 학습공동체의 학습네트워크 탐색 : 페이스북 그룹을 중심으로
- 2016년 촛불집회의 페이스북 댓글 데이터를 통해 본 하이브리드 미디어 현상
- 구조방정식을 활용한 상해보험 가입의 결정요인 분석
- 가계부채총액 분류 및 예측의 연도별 변화양상 탐구
- 스포츠산업 취업 정보 인지에 따른 구직 효능감과 구직 의도에 관한 연구
- 결측자료의 k-평균 군집분석
- Exact Inference for Competing Risks Model with Generalized Progressive Hybrid Censored Exponential Data
- 환경산업체의 생존분석에 관한 실증연구
- 교사가 지각한 유아의 방해성 및 불안정성에 영향을 미치는 유아수준과 교사수준 요인의 효과: 다수준 모형의 적용
- 한국유서와 미국유서 간 비교연구: K-LIWC와 의미추출법(MEM)을 중심으로
- 청년층의 중소기업 정착요인 및 임금효과에 관한 연구
- 운동화 브랜드 진정성이 브랜드 태도 및 소비자 구매행동에 미치는 영향
- D 지역 대학생의 음주정도와 자기효능감 및 대인관계능력
- 일반노년층의 단어정의하기 과제의 실시방법
- A Simultaneous Inference for the Multivariate Data
- 은행의 신용위험 결정요인에 관한 분석기간별 비교연구: 대출자산 구성변화를 중심으로
- 베이지안 접근법을 활용한 서울시 도시재생 사업의 편익 산정
- A Study on Fundamentals as Determinants of Firm Value under Restriction of Size, Governance and Diversification
- 삶의 질에 영향을 미치는 개인 및 지역사회 수준의 관련요인
- Determinants of Foreign Investors’ Demand for Korean Treasury Bonds
- R&D 투자가 산출물에 미치는 영향 분석 : 선도기업 및 후발기업의 조절효과
- The Order of Korean Firms’ Chinese Sequential Investments and the Production Effects
- An Empirical Examination of Consumption Effects by Immigrant Skill Group
- 간호사를 위한 마음관리 프로그램 개발 및 효과
- 연관성 규칙에서 균형화된 교차 엔트로피 측도의 제안
- 간호사가 지각한 윤리적 풍토, 윤리적 리더십이 도덕적 고뇌에 미치는 영향
- 체질별 식품의 유익여부와 특성과의 관계 분석
- 2015 농업인의 업무상 손상조사
- 대학생들의 생활 스트레스, 수면 유형, 수면의 질 간의 관계 분석: 기숙사 거주 학생들을 중심으로
- VOCs 삭감을 통한 오존농도 감소의 건강 편익 추정 연구
- 비과세 해외펀드제도의 정책 효과성에 관한 연구
- 간호사인력의 수급 현황과 중장기 추계
- 과거시차를 고려한 지지벡터 회귀모형에 기반한 서울지역 가뭄예측
- Evaluating Prediction Performance of Link Functions in Diagnosis Models for Alcohol Addiction
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!