본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

영과잉 계수형 자료 분석을 위한 허들 나무모형 구축

이용수 78

영문명
Hurdle Decision Tree for Zero Inflated Count Data
발행기관
한국자료분석학회
저자명
백유민(Yu Min Baek) 조형준(HyungJun Cho)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.19 No.4, 1831~1840쪽, 전체 10쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2017.08.31
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

영과잉 계수형 자료란 반응변수가 0 이상의 숫자로 이뤄진 자료 중 0이 과도하게 관측되는 형태를 의미한다. 영과잉 계수형 자료를 분석하기 위한 모형으로 영과잉 포아송 모형, 허들 모형 등이 개발되었으며 이를 위한 의사결정나무 방법론으로 영과잉 포아송 나무모형이 제안되었으나 분류변수선택의 편향과 과도한 계산비용의 문제가 발생하였다. 이를 해결하기 위해 영과잉 자료분석을 위한 의사결정나무가 제안되었지만 특정 형태의 영과잉 계수형 자료만 설명할 수 있다는 한계가 있다. 따라서 본 논문에서는 모든 형태의 영과잉 계수형 자료를 아우를 수 있도록 영과잉 포아송 모형이 아닌 허들 모형을 기반으로 한 의사결정나무 모형을 제안하고자 한다. 또한 분류변수 선택과 분류지점 선택을 분리한 잔차분석방법을 통한 알고리즘을 제안하였다. 이를 분류 가능한 모든 경우를 고려하는, 기존의 의사결정나무 알고리즘으로 널리 알려진 전체탐색 방법과 비교하여 변수 선택과 계산시간의 비효율성이 개선됨을 검증하였다. 마지막으로 실제 사례에 전체탐색방법과 잔차분석방법을 기반으로 한 나무모형을 적용시켜 제안한 모형의 효율을 확인하였다.

영문 초록

Zero-inflated count data refers to a form in which zeros are overestimated in responses with a number greater than or equal to zero. For analyzing zero-inflated count data, zero-inflated Poisson and Hurdle models were developed. A zero-inflated decision tree was also developed, but it has a bias problem in selecting split variables and excessive computational cost. To solve these problems, an alternative decision tree algorithm has been proposed, but it is limited in that only certain types of zero-inflated data can be explained. Therefore, we propose a new decision tree based on a Hurdle model rather than a zero-inflated Poisson model to cover all forms of zero excess count data. Our proposed algorithm is based on residual analysis that separates split variable and point selections. It is verified that split variable selection and computation time can be improved by comparing with the conventional search algorithm. Finally, the efficiency of the proposed model is confirmed by comparing exhaustive search method and residual analysis with simulated and is demonstrated with real data.

목차

1. 서론
2. 허들 나무 분석 방법론
3. 모의실험
4. 사례연구
5. 결론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

백유민(Yu Min Baek), 조형준(HyungJun Cho). (2017).영과잉 계수형 자료 분석을 위한 허들 나무모형 구축. Journal of The Korean Data Analysis Society (JKDAS), 19 (4), 1831-1840

MLA

백유민(Yu Min Baek), 조형준(HyungJun Cho). "영과잉 계수형 자료 분석을 위한 허들 나무모형 구축." Journal of The Korean Data Analysis Society (JKDAS), 19.4(2017): 1831-1840

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제