학술논문
선형모형의 선택에 관한 통계적 기계학습
이용수 100
- 영문명
- Statistical Learning beyond Linear Model: Comparative Study of Variable Selection Method
- 발행기관
- 한국자료분석학회
- 저자명
- 서혜선(Hyesun Suh)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.6, 2643~2653쪽, 전체 11쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2021.12.31
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
일반적으로 선형회귀모형에서 설명변수의 수가 많을 때는 변수선택을 통한 최적의 변수 집합(best subset)을 만들어주는 것이 필요하다. 본 연구에서는 이런 경우 주로 사용하는 변수선택 모형으로 전진선택법(forward stepwise selection) 및 후진 제거법(backward elimination) 그리고 다양한 규제를 통해 최적의 변수를 선택하는 shrinkage 방법론인 능형회귀(ridge regression)과 라쏘(lasso)방법론을 비교하여 각 각의 방법론에서 선택된 최적의 변수들을 비교하고자 한다. 이렇게 하는 이유는 보다 나은 예측 정확도와 모델 해석을 위한 과정이라 할 수 있다. 이러한 비교연구를 위해 사용된 데이터는 D대학의 SW관련 교과목에 대한 만족도 설문자료이다. D대학의 SW관련 교과목을 전체 학생의 필수 교양과목으로 확대시키는 과정에서 관련 교과목의 만족도에 영향을 주는 최적의 변수들을 선택하고자 하는 것이다. 사용된 변수들은 교수의 교과목에 대한 열정, 수업 수준의 적절성, 특히 코로나-19하에서 학교의 온라인 교육환경 수준 등 다양하고 많은 변수들을 사전에 고려하였다. 본 연구 방법론을 통해 최적화된 변수들을 선정하고자 하였으며 결과적으로 라쏘모델에 의한 7개의 설명변수를 최종 선택하여 매년 SW관련 교과목 만족도를 평가하고자 한다.
영문 초록
When the number of explanatory variables in a general linear regression model is large, it is necessary to make the best subset through variable selection. In this study, in addition to the forward stepwise selection method and backward elimination method, which are mainly used in such cases, ridge regression and lasso method, which are shrinkage methodologies that select the optimum variable through a certain regulation, are compared, and the optimal variables selected in each method are compared. The reason for doing this can be said to be a process for better prediction accuracy and model interpretation. The data used for this comparative study are satisfaction survey data for SW-related subjects at University D. This is to select the optimal variables that affect the satisfaction of related subjects in the process of expanding the SW-related subjects of University D to the compulsory liberal arts subjects for all students. Various variables were considered, such as the professor s enthusiasm for the subject, the appropriateness of the class level, and the online educational environment for non-face-to-face classes in schools especially under the COVID-19 pandemic. Optimized variables were selected through this research methodology, and as a result, seven explanatory variables by the Lasso model were finally selected to evaluate the satisfaction of SW-related subjects every year.
목차
1. 서론
2. 연구 배경 및 연구 방법론
3. 실증 분석
4. 결론
키워드
해당간행물 수록 논문
- 가상화폐 시장은 효율적인 시장인가?
- 태풍 정보에 따른 떫은 감 농가 피해율 분석
- 여행비용 접근법을 활용한 서울숲의 방문가치 산정
- 세제혜택과 소기업·소상공인 공제부금 가입 의사 결정
- 토픽 모델링을 통한 피트니스 산업 관련 연구 동향 분석
- Spatially Lagged Covariate Model with Zero Inflated Conway-Maxwell-Poisson Distribution Model for the Analysis of Pedestrian Injury Counts
- 보험회사의 당기손익조정접근법 적용과 기업가치 관련성
- 텍스트마이닝을 이용한 D대학교 서술형 강의평가 내용분석
- 1인 성인 가구의 정신건강과 삶의 질의 관계
- Journal of The Korean Data Analysis Society Vol.23 No.6 목차
- 대학생의 음주문화, 음주동기가 문제음주에 미치는 영향
- 은행의 재무적 특성과 대출 종류별 공급변화 사이의 관계
- 다문화가정 어머니의 스트레스 잠재계층 유형분류 및 자녀특성 분석
- 개인별 생활 루틴을 반영한 초개인화 추천 시스템
- 한우 무게 추정을 위한 영상 분할 방법의 고찰
- 주거환경 취약지역에 대한 도시재생 뉴딜사업의 실태분석
- 선형모형의 선택에 관한 통계적 기계학습
- 연장된 이단계 보증모형에 대한 비용 분석
- 비대면 상황에서 간호대학생의 생활 스트레스와 심리적 안녕감이 대학생활적응에 미치는 영향
- 선거 기간 정부지출 증가가 지역소득에 미치는 효과
- Impact of Teacher Turnover on Student Performance
- 로하스 관광동기가 로하스가치, 관광가치 및 만족에 미치는 영향
- Clustering County-wise COVID-19 Dynamics in North Carolina, USA
- 체계적 측정오차를 포함한 반응변수의 회귀모형 추론
- 부산시 신혼부부임대주택 입지특성요인 분석
- 소유구조와 발생액 질
- Network and Cluster Analysis of the Funding Relationship among the U.N. Agencies and State Donors
- 농식품 소비자 패널을 활용한 과일 소비행태 분석
- 자연어 처리를 활용한 D 대학교 교양교육튜터링 참여자 텍스트 분석
- 지역축제의 경제적 효과에 관한 실증 분석
- 유튜브와 K-POP 아이돌 팬덤 분석
- 사전 정보의 기억이 전환 과제 수행에 미치는 영향
- 국내 여성 프로골퍼와 미국 여성 프로골퍼의 경기력 비교
- 기업의 사회적 책임이 경영성과에 미치는 영향
- 유통점포의 효율성 분석 사례
- Dynamic Characteristics of Excess Returns in Seoul Housing Market
- 대학생의 진로스트레스가 우울에 미치는 영향
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!