본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용

이용수 63

영문명
Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application
발행기관
한국시뮬레이션학회
저자명
김동일(Dong-II Kim) 박정술(Cheong-Sool Park) 백준걸(Jun-Geol Baek) 김성식(Sung-Shick Kim)
간행물 정보
『한국시뮬레이션학회 논문지』제18권 제4호, 137~148쪽, 전체 12쪽
주제분류
공학 > 기타공학
파일형태
PDF
발행일자
2009.12.30
4,240

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 논문의 목적은 신뢰성 있는 선형회귀모델을 구축하기 위하여 후보독립변수 중 유효변수를 선택하는 알고리즘을 구현하는 것이다. 선형회귀모델을 구축하는데 있어서 데이터 상의 모든 후보독립변수를 포함하는 것은 모델의 통계적 유의성을 감소시킬 수 있으며, 차원의 저주(Curse of dimensionality)를 유발할 수 있고, 데이터의 개수보다 변수의 개수가 많을 경우 모델의 구축이 불가능한 문제점 등이 있다. 이와 같은 문제점을 해결하기 위하여 변수선택의 문제를 조합최적화의 문제로 보고 유전 알고리즘(Genetic Algorithm)을 활용하였다. 일반적으로 선형회귀모델의 통계적 유의성을 평가하는 대표적인 통계량으로는 종 속변수에 대한 독립변수의 설명력을 나타내는 결정계수(R²), 회귀식의 통계적 유의성을 검정하는 F통계량, 회귀계수의 통계적 유의성을 검정하는 t통계량, 잔차의 표준오차 등이 있다. 모델의 통계적 유의성은 하나의 통계량으로 표현될 수 없으므로 다양한 기준을 고려한 다중목적식(Multi-objective function)을 가지는 유전 알고리즘을 설계하였다. 설계한 알고리즘의 성능평가를 위하여 다양한 조건을 가정한 시뮬레이션 데이터에 적용하였다. 그 결과 구축한 알고리즘이 유효변수를 판단함에 있어 기존의 대표적인 변수선택 알고리즘인 LARS(Least Angle Regression)에 비해 우수한 성능을 보임을 확인할 수 있었다. 또한, 주가 데이터를 이용한 포트폴리오 선택에 적용해 본 결과 우수한 응용문제 해결 능력이 있음을 확인할 수 있었다.

영문 초록

The purpose of this study is to implement variable selection algorithm which helps construct a reliable linear regression model. If we use all candidate variables to construct a linear regression model, the significance of the model will be decreased and it will cause Curse of Dimensionality . And if the number of data is less than the number of variables (dimension), we cannot construct the regression model. Due to these problems, we consider the variable selection problem as a combinatorial optimization problem, and apply GA (Genetic Algorithm) to the problem. Typical measures of estimating statistical significance are R², F-value of regression model, t-value of regression coefficients, and standard error of estimates. We design GA to solve multi-objective functions, because statistical significance of model is not to be estimated by a single measure. We perform experiments using simulation data, designed to consider various kinds of situations. As a result, it shows better performance than LARS (Least Angle Regression) which is an algorithm to solve variable selection problems. We modify algorithm to solve portfolio selection problem which construct portfolio by selecting stocks. We conclude that the algorithm is able to solve real problems.

목차

1. 서론
2. 선형회귀모델
3. 변수선택을 위한 다중목적 유전 알고리즘
4. 실험 및 분석
5. 결론 및 추후 연구
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김동일(Dong-II Kim),박정술(Cheong-Sool Park),백준걸(Jun-Geol Baek),김성식(Sung-Shick Kim). (2009).선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용. 한국시뮬레이션학회 논문지, 18 (4), 137-148

MLA

김동일(Dong-II Kim),박정술(Cheong-Sool Park),백준걸(Jun-Geol Baek),김성식(Sung-Shick Kim). "선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용." 한국시뮬레이션학회 논문지, 18.4(2009): 137-148

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제