학술논문
선형판별분석에서의 변수 선택
이용수 13
- 영문명
- Variable Selection in Linear Discriminant Analysis
- 발행기관
- 한국자료분석학회
- 저자명
- 하재환(Jae Whan Ha) 박창이(Changyi Park)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.11 No.1, 381~389쪽, 전체 9쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2009.02.28
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
선형판별분석은 로지스틱회귀와 함께 현실의 문제에 자주 사용되는 분류기법이다. 그러나 고차원 자료에 대하여 선형판별분석은 몇 가지 단점이 있다. 선형판별분석은 변수 선택 기능이 없기 때문에 그 최종모형의 해석력이 떨어질 수 있고 잡음변수가 많아지면 예측력 또한 떨어질 수 있다. Bishop(1995)에 따르면 이항분류(binary classification)문제에서 선형판별분석과 출력변수를 적절히 새로 코딩한 회귀분석의 해가 동일하다. 본 논문에서는 이러한 결과를 이용하여 라쏘(least absolute shrinkage and selection operator, LASSO) 회귀를 통한 변수선택을 연구한다. 기존 회귀분석의 최적 부분집합 선택법(best subset selection)은 불연속적으로 부분집합의 선택이 이루어지는 반면 LASSO 회귀는 연속적으로 선택을 한다. 특히 본 논문의 방법은 실제 판별함수가 성근(sparse) 경우에 성근 해를 준다. 따라서 이 방법은 변별력 있는 변수의 개수가 작은 고차원 자료에서 효과적일 것으로 기대된다. 모의실험 및 실제 자료 분석을 통하여 이 방법이 잡음 변수가 많은 경우에 설명력 있는 변수들을 효과적으로 잘 선택하고 선형판별분석과 최적 부분집합 선택법에 비해 더 효율적임을 보였다.
영문 초록
Along with logistic regression, linear discriminant analysis is a commonly used classification technique in practice. However, for high dimensional data, linear discriminant analysis has some drawbacks. Since linear discriminant analysis does not have the capability of variable selection, its final model may be difficult to interpret and its prediction error may increase due to noise variables in the final model. According to Bishop (1995), linear discriminant analysis and the regression with appropriately transformed output variable yield the same solution. In this paper, we study variable selection problem via a penalized regression with LASSO penalty. While best subset selection methods in regression does a discrete subset selection, LASSO regression does a continuous selection. In particular, the method yields sparse solution when true underlying discriminant function is sparse. So the method is expected to be efficient for high dimensional data with a few relevant variables. Through simulated and real data analysis, we illustrate that the method can select relevant variables effectively and may outperform linear discriminant analysis and best subset selection in presence of noise variables.
목차
1. 서론
2. SLDA에 대한 소개
3. 자료 분석
4. 결론
참고문헌
해당간행물 수록 논문
- 요부강화 프로그램이 간호사의 요통, 유연성 및 근력에 미치는 효과
- 욕구만족척도의 개발 및 타당화
- Two Sample Nonparametric Test under the Additive Hazards Model
- Analysis of Clustered Binominal Data Using Logistic-GLMMs
- 운전 도로조건 복잡성에 따른 인지적 부하수준과 심박율의 변화
- Beers와 Greville 보정방법에 의한 사망확률 보정방법 비교 연구
- 스펙트럼 분석을 이용한 시계열 자료의 패턴 분류
- 2005 국민건강영양조사자료를 이용한 지역별 고혈압 유병율 분석
- Dispersion Parameter of Poisson-Gamma Model in the Small Area Estimation
- 선형판별분석에서의 변수 선택
- 혼합효과모형을 이용한 데이터마이닝 알고리즘 비교연구
- 형상진단기 연구개발에 대한 수요조사
- 흡연자들의 보상민감성 수준에 따른 태도가 흡연추구행동에 미치는 영향
- 일개 대학의 응급구조과 학생과 타 계열 학생들의 윤리적 가치관 비교
- 공간 주성분을 이용한 오존데이터 탐색
- 호텔 컨벤션 고객의 참가동기 세분시장별 선택속성 및 만족도가 행동의도에 미치는 영향
- 지분된 범주를 가진 분류문제에 대한 계층적 분류분석 방법
- 상관성을 반영한 부도예측모형의 적합성검증
- 한국자료분석학회 웹사이트에 대한 웹로그 분석
- 심혈관질환 위험 요인과 맥파속도의 관계
- 날씨가 주식시장에 미치는 영향
- 노인의 거주유형별 일상생활 수행능력의 장애, 지각된 건강상태 및 우울의 비교연구
- 경남사회지표조사에 대한 분석 및 제언
- 데이터마이닝과 마케팅리서치에서 토빗모형의 응용에 관한 사례 연구
- 로지스틱 회귀모형을 이용한 프로야구 홈경기의 이점에 관한 연구
- 일부 대학생의 운동유무에 따른 건강행위와 식습관 및 영양소섭취에 관한 연구
- Sub-components’ Differential Functions of Working Memory during Visual Search : An fMRI Study
- 의사결정나무를 이용한 T LOGIN/WiBro 고객세분화
- A Study on the Relationship between Brand Attributes Impact and Situational Involvement : The Case of Restaurants
- 종사유형에 따른 보험설계사 특성 분석
- 해부학 실습교육에서 의사소통기술을 활용한 해부설명회의 적용
- 이공계를 위한 기업경영관련 교과목 개발에 관한 소고
- 대학 수업 자체점검지표의 개발
- 국내주식시장 투자자의 허딩행위에 관한 연구
- 지적자본가치의 유용성
- 해양스포츠 참여 동기가 해양스포츠 활동의 신뢰도와 만족도에 미치는 영향에 관한 연구
- 부산지역 금융공공기관 이전에 따른 파급효과 분석
- Comparative Studies of the Reliability Estimation for the Mixed Weibull Distribution
- 성인의 운동행위 유지와 영향요인
- 지식창출에 대한 팀의 응집력과 흡수역량의 영향
- 해양관광지로서 해수욕장 여가행동 특성에 관한 연구
- Bayesian Estimation of the Reliability Function of the Exponentiated Weibull Distribution from Progressive Type II Censored Data
- Effect of the BUDDEUMI Therapy on the Relief of Premenstrual Syndrome and Dysmenorrhea in Female College Students
- Heuristic Testing for Independence versus Equicorrelation
- 보험사의 고객 이탈에 대한 예측모형 개발
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!