본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

분류 분석을 위한 명목형 예측변수 변환 방법

이용수 91

영문명
Transformation of Nominal Variables for Classification Analysis
발행기관
한국자료분석학회
저자명
김지우(Ji Woo Kim) 조형준(HyungJun Cho)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.23 No.4, 1569~1579쪽, 전체 11쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2021.08.30
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

로지스틱회귀모형, 선형판별분류분석, 의사결정나무, 지지벡터기계 같은 다양한 방법으로 수행할 수 있는 분류 분석은 반응변수와 예측변수의 정보를 이용하여 개체를 특정 집단으로 분류하는 것이다. 일반적으로 분류 분석의 모형 추정은 예측변수가 연속형일 때 주로 정의 되어져 있다. 명목형 예측변수를 이용하기 위해 가변수 변환 후에 사용하고 있지만, 이는 반응변수 또는 명목형 예측변수의 범주가 많은 경우에 차원의 기하급수적 증가로 인하여 필요 모수 추정이 불안하여 비정칙 같은 문제점이 종종 발생한다. 적용 가능한 예측변수가 많아지고 다양해지면서 가변수 변환을 적용할 수 없는 경우도 발생한다. 따라서, 분류 분석에서 명목형 예측변수를 효과적으로 사용하기 위해 다른 변환 방법이 필요하다. 대안으로 반응변수의 정보를 반영하여 명목형 범주에 순서를 적절히 부여하는 CRIMCOORD 변환 방법을 소개한다. 이를 분류 분석에서 예측력을 가변수 변환과 비교 분석한다. 실제 자료를 훈령용와 검증용으로 분할하여 분류 분석 방법을 적용한 비교 실험 결과, CRIMCOORD 변환은 가변수 변환의 문제점을 보완해 주었다. 정보의 일부 손실에도 불구하고 손실을 최소하는 변환으로 분류 분석에서 예측력이 감소하지 않는 결과를 얻었다.

영문 초록

Classification analysis, which can be performed by logistic regression, linear discriminant analysis, decision trees, support vector machine, utilizes the information of response and predictor variables. In general, model estimation is defined well when predictor variables are continuous. For nominal variables, dummy variable transformation is often employed; however, when the number of categories of response and predictor variables is large, the dimensionality is inflated dramatically and a singularity problem may occur because of unstable parameter estiomation. Various predictor variables may not be applicable for it. Therefore, alternative transformations are needed to utilize nominal variables efficiently. As an alternative, CRIMCOORD transformation is introduced and compared. As the result with train and test data partitions applied to classification analysis, CRIMCOORD remedies the problem of dummy variable transformation. In spite of somewhat loss of infromation, the prediction accuracy has not been decreased in classification analysis by minimizing the loss.

목차

1. 서론
2. 분류 분석 방법론
3. 명목형 예측변수 변환 방법론
4. 비교 실험
5. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김지우(Ji Woo Kim),조형준(HyungJun Cho). (2021).분류 분석을 위한 명목형 예측변수 변환 방법. Journal of The Korean Data Analysis Society (JKDAS), 23 (4), 1569-1579

MLA

김지우(Ji Woo Kim),조형준(HyungJun Cho). "분류 분석을 위한 명목형 예측변수 변환 방법." Journal of The Korean Data Analysis Society (JKDAS), 23.4(2021): 1569-1579

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제