학술논문
로지스틱 회귀를 이용한 의사결정 나무의 분기점 선택에 대한 연구
이용수 12
- 영문명
- A Study on Decision Tree using Logistic Regression Coefficients
- 발행기관
- 한국자료분석학회
- 저자명
- 정민규(Min Kyu Jung) 이성건(Seong Keon Lee)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.10 No.3, 1517~1526쪽, 전체 10쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2008.06.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
많은 의사결정 나무 방법은 분리변수(split variable) 선택에 있어 범주형 분리변수에 대해 편향을 가지고 있다. 즉 많은 범주를 갖는 범주형 변수가 분리 변수로 더 많이 선택되는 경향이 있다. 이에 Loh & Shih(1997)는 변수선택에 있어서 무시할만한 편향을 가지며 통계적 검정법을 사용하는 QUEST(Quick, Unbiased, Efficient, Statistical Tree) 방법을 제안하였다. 그러나 이 방법은 분류 정확도와 최종나무크기 면에서는 우세하다고 할 수 없다.본 논문에서는 범주형 변수에 대한 편향의 문제를 해결하는 방법으로, 범주형 변수를 독립변수로 한 로지스틱 회귀모형을 구축하여 각 범주에 해당하는 로지스틱 회귀계수를 이용해 범주들을 순위로 변환한 후 지니 지수(Gini index)를 의사결정나무 분석에 사용하는 분류나무를 제안하였다. 또한 실제 데이터를 이용하여 모형의 정확도(accuracy)와 최종나무크기(tree size) 측면에서 기존의 방법과 비교하였다.
영문 초록
There are some selection bias of splitting categorial variables. Variables which have more categories tend to be selected as split variables. Loh and Shih (1997) have proposed a statistical tree QUEST(Quick, Unbiased, Efficient, Statistical Tree) which is not biased to select split variables.In this study, we propose a decision tree method using logistic regression coefficient as a transformation method which transforms categorical variables to ordinal. Then we apply CART to transformed data. Finally we compare the proposed method with previous decision tree applying real data sets in the view of tree sizes and accuracies.
목차
1. 서론
2. 의사결정나무
3. 로지스틱 회귀계수를 이용한 의사결정나무
4. 사례분석
5. 결론
참고문헌
키워드
해당간행물 수록 논문
- 공식통계자료의 상용화 문제
- 영상 밝기와 대비가 워터마크 세기에 미치는 영향 분석
- 로지스틱 회귀를 이용한 의사결정 나무의 분기점 선택에 대한 연구
- Modified Confidence Intervals by Broemeling s Method in Two-Factor Nested Variance Components Model
- Inward & Outward FDI Stocks and Income Inequality : An Empirical Investigation
- 담배 및 주류 소비가 보건의료지출에 미치는 효과분석
- 통계적 뇌파분석(SEEG)
- 자기희생적 리더십의 영성
- 계절조정 방법을 이용한 지적측량 업무량 예측
- 그룹별 수능 및 학생부 성적과 대학 입학 후 성적 분석
- 형상의학에서 3차원 얼굴 데이터에 대한 통계적 방법 연구
- DRE 전자투표 시스템에 대한 안전성 비교 및 분석
- 매개연관규칙과 매크로 알고리즘의 개발
- 건강증진 행위분석을 위한 정서모형 검증
- 2007 광고 산업 통계조사에서 발생하는 결측값 대체방법에 관한 연구
- 선물거래가 주식시장 변동성의 크기 및 비대칭성에 미치는 영향
- 경혈지압을 병행한 운동요법이 외래 간호 인력의 피로도 및 견통에 미치는 효과
- 추천시스템에서 분류함수에 의한 선호도 예측 평가에 관한 연구
- 지역통계 활성화를 위한 수요분석
- Metastasis Related Gene Exploration Using TwoStep Clustering for Medulloblastoma Microarray Data
- 금융겸업의 규모 및 범위의 경제 효과
- Constraint and Dedication based Motivations on Use Continuance for a Web Portal Site
- 증강현실 항법시스템이 운전자의 운전수행과 정보처리에 미치는 효과
- Coverage of the Horvitz-Thompson Estimator
- 제한된 반응변수의 모형화에 관한 연구
- 합병 후 수정DEA 모형을 이용한 증권선물거래소의 경영효율성 변화연구
- 여행사 종사원의 직무만족이 서비스몰입과 기업성과에 미치는 영향
- 3차원 안면형상분석기를 이용한 안면계측변수 유의도 검정
- 일일 최고온도의 극값에 대한 통계적 경향분석
- 건강-의료계통 관련 전공자를 위한 해부학교육에서 Blended Learning의 적용 및 효과분석
- A Spatial Bootstrap Method for Kriging Variance
- 다양한 데이터마이닝 분석법을 이용한 고객 금융서비스의 분석
- 공동주택단지에 있어서 주거환경이 조망권에 미치는 영향분석
- 연결분석의 응용에 관한 연구
- 의사결정나무분석을 통한 가계조사의 무응답 특성 연구
- 어린이의 안전 횡단 행동에 미치는 맞춤형 프롬프트의 효과 검증
- 사후층화를 이용한 확률화응답자료의 무응답 편향 추정
- 통계학 관련 학회 웹사이트 현황 및 네트워크 분석
- The Anti-diabetic Effect of Ginseng in Experimental Diabetic Rats: Meta Analysis
- Data Adaptive Estimation in Generalized Extreme Value Distribution
- 고객 만족 통합 지수 도출에 관한 연구
- Comparing American and Japanese Insurers Financial Strength
- 주식형 펀드의 포트폴리오 펌핑과 성과 이전 현상에 관한 연구
- 해양레저참여자 특성분석을 통한 해양레저관광 발전방안
- 운전전문학원과 일반운전학원의 출신운전자별 교통사고율 비교에 관한 연구
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!