본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

이항 회귀모형의 연결함수 오지정 문제에서 확률화된 분위수 잔차 사용에 대한 연구

이용수 57

영문명
On the usage of the randomized quantile residuals for the link misspecification in logistic regression models
발행기관
한국자료분석학회
저자명
양호진(Hojin Yang) 이동혁(Donghyuk Lee)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.24 No.5, 1693~1704쪽, 전체 12쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2022.10.31
4,240

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

반응변수가 베르누이 혹은 이항분포를 따를 때 공변량들로 관심사건이 발생할 확률을 예측하는 모형에 흔히 로지스틱 회귀모형이 사용된다. 이는 로지스틱 연결함수를 사용한 일반화 선형모형의 일종으로 실제 자료를 생성시키는 연결함수가 로지스틱 연결함수가 아닐 때 연결함수 오지정(link misspecification) 문제가 발생한다. 회귀모형을 진단하는 방법으로 잔차를 활용할 수 있지만, 반응변수가 범주형이면 잔차들의 활용도가 일반적인 선형회귀분석에 비하여 떨어지게 된다. 이를 보완하기 위하여 확률화된 분위수 잔차(randomized quantile residual)를 사용할 수 있는데 이들은 모형이 정확할 때 정규분포를 따르도록 정의되었다. 본 연구에서는 연결함수 오지정 문제를 진단하기 위한 확률화된 분위수 잔차의 활용도를 살펴보았다. 실제 자료를 생성시키는 연결함수가 로지스틱 연결함수가 아닐 때 로지스틱 회귀모형을 사용한 경우, 확률화된 분위수 잔차들의 정규성 검정을 통하여 연결함수의 오지정 유무를 진단할 수 있는지 다양한 모의실험을 통하여 검증하였다. 이를 통하여 로지스틱 연결함수가 실제 연결함수를 잘 근사하지 못하여 실제 연결함수가 적합된 로지스틱 연결함수와 차이가 클 때 확률화된 분위수 잔차들은 정규분포를 따르지 않게 됨을 확인하였다.

영문 초록

Logistic regression model is usually used when the response is Bernoulli or binomial to predict the probability of event of interest. Specifically, the logistic model is a generalized linear model(GLM) where the assumed link function is the inverse CDF of the logistic distribution. The link misspecification often occurs when the true link is not the logistic link function. In addition, residuals in the binomial GLM model are of less practical use for diagnostics because the response is not continuous. Randomized quantile residuals are an alternative option because they are defined to follow the standard normal distribution. In this study, we investigated the usage of the randomized quantile residual to diagnose the link misspecification. When the logistic regression is fitted to the data where the true data generating process is irrelevant to the logistic link function, we consider the normality test on the randomized quantile residuals from the misspecified logistic regression model and explore whether the link misspecification can be detected or not via extensive simulation studies. We have found that the randomized quantile residual is far from the normality especially when the fitted logistic link function fails to approximate the true link function so that their gap is big.

목차

1. 서론
2. 이항 회귀모형의 연결함수 오지정과 확률화된 분위수 잔차
3. 모의실험
4. 토의 및 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

양호진(Hojin Yang),이동혁(Donghyuk Lee). (2022).이항 회귀모형의 연결함수 오지정 문제에서 확률화된 분위수 잔차 사용에 대한 연구. Journal of The Korean Data Analysis Society (JKDAS), 24 (5), 1693-1704

MLA

양호진(Hojin Yang),이동혁(Donghyuk Lee). "이항 회귀모형의 연결함수 오지정 문제에서 확률화된 분위수 잔차 사용에 대한 연구." Journal of The Korean Data Analysis Society (JKDAS), 24.5(2022): 1693-1704

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제