학술논문
선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용
이용수 63
- 영문명
- Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application
- 발행기관
- 한국시뮬레이션학회
- 저자명
- 김동일(Dong-II Kim) 박정술(Cheong-Sool Park) 백준걸(Jun-Geol Baek) 김성식(Sung-Shick Kim)
- 간행물 정보
- 『한국시뮬레이션학회 논문지』제18권 제4호, 137~148쪽, 전체 12쪽
- 주제분류
- 공학 > 기타공학
- 파일형태
- 발행일자
- 2009.12.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 논문의 목적은 신뢰성 있는 선형회귀모델을 구축하기 위하여 후보독립변수 중 유효변수를 선택하는 알고리즘을 구현하는 것이다. 선형회귀모델을 구축하는데 있어서 데이터 상의 모든 후보독립변수를 포함하는 것은 모델의 통계적 유의성을 감소시킬 수 있으며, 차원의 저주(Curse of dimensionality)를 유발할 수 있고, 데이터의 개수보다 변수의 개수가 많을 경우 모델의 구축이 불가능한 문제점 등이 있다. 이와 같은 문제점을 해결하기 위하여 변수선택의 문제를 조합최적화의 문제로 보고 유전 알고리즘(Genetic Algorithm)을 활용하였다. 일반적으로 선형회귀모델의 통계적 유의성을 평가하는 대표적인 통계량으로는 종 속변수에 대한 독립변수의 설명력을 나타내는 결정계수(R²), 회귀식의 통계적 유의성을 검정하는 F통계량, 회귀계수의 통계적 유의성을 검정하는 t통계량, 잔차의 표준오차 등이 있다. 모델의 통계적 유의성은 하나의 통계량으로 표현될 수 없으므로 다양한 기준을 고려한 다중목적식(Multi-objective function)을 가지는 유전 알고리즘을 설계하였다. 설계한 알고리즘의 성능평가를 위하여 다양한 조건을 가정한 시뮬레이션 데이터에 적용하였다. 그 결과 구축한 알고리즘이 유효변수를 판단함에 있어 기존의 대표적인 변수선택 알고리즘인 LARS(Least Angle Regression)에 비해 우수한 성능을 보임을 확인할 수 있었다. 또한, 주가 데이터를 이용한 포트폴리오 선택에 적용해 본 결과 우수한 응용문제 해결 능력이 있음을 확인할 수 있었다.
영문 초록
The purpose of this study is to implement variable selection algorithm which helps construct a reliable linear regression model. If we use all candidate variables to construct a linear regression model, the significance of the model will be decreased and it will cause Curse of Dimensionality . And if the number of data is less than the number of variables (dimension), we cannot construct the regression model. Due to these problems, we consider the variable selection problem as a combinatorial optimization problem, and apply GA (Genetic Algorithm) to the problem. Typical measures of estimating statistical significance are R², F-value of regression model, t-value of regression coefficients, and standard error of estimates. We design GA to solve multi-objective functions, because statistical significance of model is not to be estimated by a single measure. We perform experiments using simulation data, designed to consider various kinds of situations. As a result, it shows better performance than LARS (Least Angle Regression) which is an algorithm to solve variable selection problems. We modify algorithm to solve portfolio selection problem which construct portfolio by selecting stocks. We conclude that the algorithm is able to solve real problems.
목차
1. 서론
2. 선형회귀모델
3. 변수선택을 위한 다중목적 유전 알고리즘
4. 실험 및 분석
5. 결론 및 추후 연구
참고문헌
키워드
해당간행물 수록 논문
- 가중 F 척도를 이용한 Trace-Driven 시뮬레이션 모델의 검증 방법
- M&S를 활용한 유도탄 검사주기 및 수량 설정 방안
- 선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용
- 최소의 Forwarding Peer 선택을 통한 애드 혹 네트워크에서의 효율적 콘텐츠 분배 방법
- 분산 컴퓨팅 환경에서의 워게임 시뮬레이션을 위한 네트워크 트래픽 제어
- Address Prefix에 기반한 우선 순위 서비스를 이용한 DDoS 방어
- 병원 응급실에서 여러 속성을 고려한 간호사 치료태스크 할당 규칙에 관한 연구
- 노드 이동성을 고려한 애드 혹 네트워크의 이산 사건 시스템 기반 모델링 및 시뮬레이션 방법론
- PLC 기반 제어정보 모델링 방법론
- 해양 센서네트워크에서 Scheduled Interest Table(SIT) 기반 다중경로 설정 기법
- 프랙탈 차원과 에이전트 기반 시뮬레이션을 이용한 지형이 전투효과에 미치는 영향 연구
- 집단 로봇 제어를 위한 수정된 플로킹 알고리즘의 시뮬레이션 검증
- 증강현실 내비게이션의 인지적·행동적 영향에 관한 연구
- 공간정보를 이용한 뇌 자기공명영상 분류
- 무선 센서 네트워크에서 웜홀 공격 방어기법의 에너지 효율향상을 위한 TTL 결정 기법
- 이산사건 시뮬레이션에서의 효율적인 이벤트 리스트 관리를 위한 MList의 개선 방안
- 플러그인 기법을 이용한 임베디드 시스템의 재사용 향상 기법
- DDoS 공격 피해 규모 및 대응기법 비용분석을 위한 모델링 및 시뮬레이션 기술연구
- 수율향상을 위한 반도체 공정에서의 RRAM (Redundant Random Access Memory) Spare Allocation
- 계층구조적 다중에이전트를 이용한 다대다 함정전투 M&S 시스템
- 국방 M&S VV&A 적용 및 발전방안 연구
- 반도체 공정 교육을 위한 교육용 컴퓨터 모델 설계 및 구현
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!