본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

계수 자료 분석을 위한 의사결정나무에서의 변수선택

이용수 25

영문명
Variable Selection in Decision Tree for Count Data
발행기관
한국자료분석학회
저자명
이석형(Seok Hyung Lee) 조형준(HyungJun Cho)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.14 No.1, 101~116쪽, 전체 16쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2012.02.28
4,720

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

의사결정나무는 데이터마이닝에서 사용되는 대표적인 방법으로 모형의 결과가 도식적으로 표현되어 해석과 예측이 쉬운 장점이 있다. 의사결정나무는 대부분 반응변수의 형태가 연속형 또는 범주형 중에 이항 또는 다항일 때 흔히 사용되었다. 또한, 대부분 알고리즘은 CART처럼 전체탐색 방법을 이용하여 분리 변수를 선택하기 때문에 계산 시간이 많이 소요되고, 분류 가능 경우의 수가 많은 변수를 선호하는 경향이 있다. 본 논문에서는 반응변수가 계수인 경우에 의사결정나무 알고리즘을 제안한다. 계수형 자료에 적합한 포아송 모형과 과분산 문제가 있을 경우에 적합한 음이항 모형을 기본으로 이용하고, 잔차 분석을 통한 빠르고 부당한 선호 현상이 없는 분류 선택 방법을 제안한다. 본 논문에서 전체탐색 방법의 문제점과 우리가 제안한 방법의 우수성을 모의실험을 통해 검증한다. 마지막으로 실제 자료를 이용하여 실용성을 보인다.

영문 초록

Decision tree is the representative tool for data mining. It is easy to interpret and predict its results because it can be expressed as a diagram. Decision trees usually have been used for continuous and binomial (or multinomial) responses. Most algorithms select split variables utilizing exhaustive search like CART, so they require a lot of computing time and unduly tend to prefer to select variables with more possible splits. In this paper, we propose a decision tree algorithm for count data. Poisson and negative binomial models are employed as a basic model and the faster and unbiased split algorithm is proposed. We investigate the unbiasedness of the variable selection algorithm through a simulation study and demonstrate it with a real example.

목차

1. 서론
2. 계수자료 분석을 위한 의사결정나무
3. 모의실험
4. 사례연구
5. 결론
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이석형(Seok Hyung Lee),조형준(HyungJun Cho). (2012).계수 자료 분석을 위한 의사결정나무에서의 변수선택. Journal of The Korean Data Analysis Society (JKDAS), 14 (1), 101-116

MLA

이석형(Seok Hyung Lee),조형준(HyungJun Cho). "계수 자료 분석을 위한 의사결정나무에서의 변수선택." Journal of The Korean Data Analysis Society (JKDAS), 14.1(2012): 101-116

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제