본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

선형모형의 선택에 관한 통계적 기계학습

이용수 76

영문명
Statistical Learning beyond Linear Model: Comparative Study of Variable Selection Method
발행기관
한국자료분석학회
저자명
서혜선(Hyesun Suh)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.6, 2643~2653쪽, 전체 11쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2021.12.31
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

일반적으로 선형회귀모형에서 설명변수의 수가 많을 때는 변수선택을 통한 최적의 변수 집합(best subset)을 만들어주는 것이 필요하다. 본 연구에서는 이런 경우 주로 사용하는 변수선택 모형으로 전진선택법(forward stepwise selection) 및 후진 제거법(backward elimination) 그리고 다양한 규제를 통해 최적의 변수를 선택하는 shrinkage 방법론인 능형회귀(ridge regression)과 라쏘(lasso)방법론을 비교하여 각 각의 방법론에서 선택된 최적의 변수들을 비교하고자 한다. 이렇게 하는 이유는 보다 나은 예측 정확도와 모델 해석을 위한 과정이라 할 수 있다. 이러한 비교연구를 위해 사용된 데이터는 D대학의 SW관련 교과목에 대한 만족도 설문자료이다. D대학의 SW관련 교과목을 전체 학생의 필수 교양과목으로 확대시키는 과정에서 관련 교과목의 만족도에 영향을 주는 최적의 변수들을 선택하고자 하는 것이다. 사용된 변수들은 교수의 교과목에 대한 열정, 수업 수준의 적절성, 특히 코로나-19하에서 학교의 온라인 교육환경 수준 등 다양하고 많은 변수들을 사전에 고려하였다. 본 연구 방법론을 통해 최적화된 변수들을 선정하고자 하였으며 결과적으로 라쏘모델에 의한 7개의 설명변수를 최종 선택하여 매년 SW관련 교과목 만족도를 평가하고자 한다.

영문 초록

When the number of explanatory variables in a general linear regression model is large, it is necessary to make the best subset through variable selection. In this study, in addition to the forward stepwise selection method and backward elimination method, which are mainly used in such cases, ridge regression and lasso method, which are shrinkage methodologies that select the optimum variable through a certain regulation, are compared, and the optimal variables selected in each method are compared. The reason for doing this can be said to be a process for better prediction accuracy and model interpretation. The data used for this comparative study are satisfaction survey data for SW-related subjects at University D. This is to select the optimal variables that affect the satisfaction of related subjects in the process of expanding the SW-related subjects of University D to the compulsory liberal arts subjects for all students. Various variables were considered, such as the professor s enthusiasm for the subject, the appropriateness of the class level, and the online educational environment for non-face-to-face classes in schools especially under the COVID-19 pandemic. Optimized variables were selected through this research methodology, and as a result, seven explanatory variables by the Lasso model were finally selected to evaluate the satisfaction of SW-related subjects every year.

목차

1. 서론
2. 연구 배경 및 연구 방법론
3. 실증 분석
4. 결론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

서혜선(Hyesun Suh). (2021).선형모형의 선택에 관한 통계적 기계학습. Journal of The Korean Data Analysis Society (JKDAS), 23 (6), 2643-2653

MLA

서혜선(Hyesun Suh). "선형모형의 선택에 관한 통계적 기계학습." Journal of The Korean Data Analysis Society (JKDAS), 23.6(2021): 2643-2653

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제