본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

연속형과 범주형의 혼합자료에 대한 혼합형 h-plot

이용수 21

영문명
The Mixed h-plot for Continuous and Categorical Data
발행기관
한국자료분석학회
저자명
박준수(Jun-Su Park) 최용석(Yong-Seok Choi) 신상민(Sang Min Shin)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.18 No.1, 151~161쪽, 전체 11쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2016.02.28
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

연속형 변수와 범주형 변수가 혼합되어 있는 자료에 대한 탐색적 분석방법으로 일반화행렬도(generalized biplots)를 이용할 수 있다. 일반화행렬도는 개체들의 비유사성(dissimilarity)을 저차원공간 상에 투영(projection)한 후, 그 위에 추가적으로 연속형과 범주형 변수들의 정보를 가상점(pseudo-points)을 이용하여 나타냄으로서 개체들의 성향을 해석하는 데 도움을 얻고자 하는 분석기법이다. 그러나 일반화행렬도는 변수의 수가 많아질수록 가상점의 위치 좌표에 대한 계산시간이 오래 걸리는 단점이 있으며, 측정 단위(measure unit)에 따른 연속형 변수와 범주형 변수가 가지는 변동(variation)의 크기 차이로, 행렬도 상에 모든 변수들의 정보를 표현했을 때 소수의 범주수준으로 표현되는 범주형 변수들에 대한 해석에 어려움을 겪을 수도 있다. 이에 본 연구에서는 연속형과 범주형의 혼합자료에 대해 적용 가능한 혼합형 h-plot을 제안하고자 한다. 이는 일반화행렬도와 달리 변수들의 정보만을 저차원 공간상에 투영시켜 그들의 관계를 탐색하고자 하는 분석기법이다. 제안하는 혼합형 h-plot은 차원축소를 위한 비정칙값분해(singular value decomposition)를 범주형 자료 부분에 대해서도 적용 가능하도록 주어진 자료행렬의 적절한 변환이 요구되는데, 이 과정상에 일반화행렬도 상에서 나타났던 측정단위에 대한 문제도 고려하였다. 따라서 혼합형 h-plot을 통해 변수들의 관계에 대한 쉽고 유용한 해석을 기대할 수 있다.

영문 초록

Generalized biplots (Gower, 1992) offer the visualization of the given data that allows both the continuous and categorical variables to be included. The algorithm of generalized biplots aims to visualize the dissimilarity of individual objects in low dimensional space. And the pseudo-points are used to represent the informations of the variables. But sometimes, it requires a long computation time for coordinates of the pseudo-points when the number of variables is large. Furthermore, it is difficult to interpret the relationship of variables due to the difference in the variation of the continuous and categorical variables. In this study, we will propose the mixed h-plot in order to interpret the relationship of variables in low dimensional space. The singular value decomposition for dimensional reduction is required the appropriate transformation for the given data. On the process, we also consider the difference in the variation of the continuous and categorical variables. Hence, we can expect that our proposed h-plot give clear and useful interpretation for the correlation of the continuous variables, the relevance of the categorical variables and the difference in the means of the continuous variables according to the levels of the categorical variable.

목차

1. 서론
2. 혼합자료에 대한 h-plot
3. 활용사례
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

박준수(Jun-Su Park),최용석(Yong-Seok Choi),신상민(Sang Min Shin). (2016).연속형과 범주형의 혼합자료에 대한 혼합형 h-plot. Journal of The Korean Data Analysis Society (JKDAS), 18 (1), 151-161

MLA

박준수(Jun-Su Park),최용석(Yong-Seok Choi),신상민(Sang Min Shin). "연속형과 범주형의 혼합자료에 대한 혼합형 h-plot." Journal of The Korean Data Analysis Society (JKDAS), 18.1(2016): 151-161

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제