본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

이상점이 존재하는 이질적 자료에 대한 로버스트 다변량 혼합회귀모형

이용수 40

영문명
Robust Multivariate Mixture Regression Models for Heterogeneous Data with Outliers
발행기관
한국자료분석학회
저자명
임화경(Hwa Kyung Lim)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.19 No.5, 2383~2394쪽, 전체 12쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2017.10.31
4,240

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

다변량 회귀모형(multivariate regression models)은 두 개 이상의 반응변수와 여러 개의 설명변수들 간의 관계를 조사하기 위해 사용된다. 자료가 이질적 모집단(heterogeneous population)으로부터 추출된 표본자료인 경우에는 부모집단(subpopulation)마다 회귀계수들이 달라지는 것을 허용하는 다변량 혼합회귀모형(multivariate mixture regression models)으로 분석할 수 있다. 다변량 혼합회귀모형은 일반적으로 정규분포 가정 하에서 모형화 되는데, 자료에 이상점(outliers) 또는 노이즈(noise)가 포함되어 있는 경우에는 로버스트(robust) 추정을 위해 t-분포를 사용하여 모형화 될 수 있다. 본 연구에서는 이질적 모집단으로부터 추출된 표본 자료에 이상점 또는 노이즈가 존재하는 경우, 표본 내에 잠재되어 있는 서브그룹(latent subgroup)들을 식별하고 각 서브그룹의 회귀계수들을 로버스트하게 추정하기 위해 다변량 t-분포를 기반으로 한 혼합회귀모형을 제안한다. 본 연구에서 제안하는 모형은 반응변수들 간의 편상관관계(partial correlation)를 파악하는데도 유용하며, 이러한 편상관관계는 그림으로 시각화(visualization)가 가능하여 서브그룹 내 반응변수 간의 고유 연관성을 쉽게 파악할 수 있다. 모의실험 결과 제안된 모형이 다른 비교 모형들에 비해 우수함을 확인하였고, 고등학생들의 시험 성적 자료에 제안된 모형을 적용하여 분석하였다.

영문 초록

Multivariate regression models are used to examine the relationship between two or more response variables and multiple explanatory variables. Data from a heterogeneous population can be analyzed using the multivariate mixture regression models that allow regression coefficients to vary across subgroups. Multivariate mixture regression models are typically modeled using normal distributions, but can be modeled using t-distributions for robust estimation if data contain outliers or noise. In this paper, a robust multivariate mixture regression model based on the multivariate t-distributions (MVTmixreg) is proposed to identify latent subgroups and robustly estimate the regression coefficients of each subgroup when there are outliers or noise in the sample from a heterogeneous population. The proposed model can also be used to find the partial correlation between the response variables in each latent subgroup. This partial correlation can be visualized by a plot. Simulation results show that the proposed model is superior to the other comparative models, and the proposed model is applied to the data of high school students’ test scores.

목차

1. 서론
2. 다변량 t-분포를 기반으로 한 혼합회귀모형
3. 모의실험
4. 사례적용
5. 결론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

임화경(Hwa Kyung Lim). (2017).이상점이 존재하는 이질적 자료에 대한 로버스트 다변량 혼합회귀모형. Journal of The Korean Data Analysis Society (JKDAS), 19 (5), 2383-2394

MLA

임화경(Hwa Kyung Lim). "이상점이 존재하는 이질적 자료에 대한 로버스트 다변량 혼합회귀모형." Journal of The Korean Data Analysis Society (JKDAS), 19.5(2017): 2383-2394

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제