본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

혼합 반응 변수를 위한 의사결정나무에서 분류 변수 선택

이용수 16

영문명
Split Variable Selection in Decision Tree for Mixed Responses
발행기관
한국자료분석학회
저자명
천재혁(Jae Hyuck Chun) 문호석(Ho Seok Moon) 이석형(Seok Hyung Lee) 조형준(HyungJun Cho)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.15 No.3, 1339~1345쪽, 전체 7쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2013.06.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

의사결정나무는 데이터마이닝에 쓰이는 대표적인 알고리즘 중 하나로 분류와 해석, 예측의 장점을 가지고 있다. 일변량 반응변수의 의사결정나무와 동일한 유형의 다변량 반응변수의 의사결정나무는 많은 연구가 되고 있다. 하지만 반응변수가 연속형과 범주형이 혼합된 자료 분석을 위한 의사결정나무는 연구가 제대로 이루어지고 있지 않다. 두 개 이상의 반응 변수를 일변량으로 따로 분석하는 것에 비해 동시에 분석할 경우에 더 간략한 모형으로 두 유형의 반응 변수를 함께 설명하고 해석할 수 있다는 장점이 있다. 기존의 알고리즘은 CART 알고리즘을 확장했기 때문에 분류변수 선택 편의와 과도한 계산비용의 문제가 존재한다. 본 논문에서는 혼합 반응변수자료 분석을 위한 의사결정나무에서 분류 변수 선택에 대해 연구하였다. 연구 결과로 전체 탐색알고리즘은 변수의 중요도보다 분할 가능한 수가 많은 변수를 선호하는 경향이 있음을 알 수 있었다. 반면에 잔차 분석 알고리즘은 변수의 분포와 상관없이 변수의 중요도에 따라 분할 변수로 선택하였다. 또한, 전체 탐색 방법에 비해 잔차 분석 방법이 월등히 빠른 계산 속도를 가짐을 확인하였다.

영문 초록

Decision tree is one of the popular data mining tools and has the merits in classification, interpretation, and prediction. A number of algorithms have been developed for univariate data, while few studies exist for the mixed response data. When there are two or more response variables of different types, the variables can be explained and interpreted at the same time by the simpler model from simultaneous analysis rather than separate analyses. The previous tree algorithms for mixed data are based on CART, so they require much computing time and tend to generate selection bias. In the paper, we studied split variable selection for mixed response data. We found that an exhaustive search algorithm had a preference to split variables with more possible splits rather than important variables. In contrast, a residual analysis algorithm accounted for variable importance for split variable selection rather than variable distribution. In addition, a residual analysis algorithm was computationally less expensive than an exhaustive search algorithm.

목차

1. 서론
2. 분할 변수 선택 알고리즘
3. 모의 실험
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

천재혁(Jae Hyuck Chun),문호석(Ho Seok Moon),이석형(Seok Hyung Lee),조형준(HyungJun Cho). (2013).혼합 반응 변수를 위한 의사결정나무에서 분류 변수 선택. Journal of The Korean Data Analysis Society (JKDAS), 15 (3), 1339-1345

MLA

천재혁(Jae Hyuck Chun),문호석(Ho Seok Moon),이석형(Seok Hyung Lee),조형준(HyungJun Cho). "혼합 반응 변수를 위한 의사결정나무에서 분류 변수 선택." Journal of The Korean Data Analysis Society (JKDAS), 15.3(2013): 1339-1345

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제