학술논문
연속형과 범주형의 혼합자료에 대한 혼합형 h-plot
이용수 21
- 영문명
- The Mixed h-plot for Continuous and Categorical Data
- 발행기관
- 한국자료분석학회
- 저자명
- 박준수(Jun-Su Park) 최용석(Yong-Seok Choi) 신상민(Sang Min Shin)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.18 No.1, 151~161쪽, 전체 11쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2016.02.28
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
연속형 변수와 범주형 변수가 혼합되어 있는 자료에 대한 탐색적 분석방법으로 일반화행렬도(generalized biplots)를 이용할 수 있다. 일반화행렬도는 개체들의 비유사성(dissimilarity)을 저차원공간 상에 투영(projection)한 후, 그 위에 추가적으로 연속형과 범주형 변수들의 정보를 가상점(pseudo-points)을 이용하여 나타냄으로서 개체들의 성향을 해석하는 데 도움을 얻고자 하는 분석기법이다. 그러나 일반화행렬도는 변수의 수가 많아질수록 가상점의 위치 좌표에 대한 계산시간이 오래 걸리는 단점이 있으며, 측정 단위(measure unit)에 따른 연속형 변수와 범주형 변수가 가지는 변동(variation)의 크기 차이로, 행렬도 상에 모든 변수들의 정보를 표현했을 때 소수의 범주수준으로 표현되는 범주형 변수들에 대한 해석에 어려움을 겪을 수도 있다. 이에 본 연구에서는 연속형과 범주형의 혼합자료에 대해 적용 가능한 혼합형 h-plot을 제안하고자 한다. 이는 일반화행렬도와 달리 변수들의 정보만을 저차원 공간상에 투영시켜 그들의 관계를 탐색하고자 하는 분석기법이다. 제안하는 혼합형 h-plot은 차원축소를 위한 비정칙값분해(singular value decomposition)를 범주형 자료 부분에 대해서도 적용 가능하도록 주어진 자료행렬의 적절한 변환이 요구되는데, 이 과정상에 일반화행렬도 상에서 나타났던 측정단위에 대한 문제도 고려하였다. 따라서 혼합형 h-plot을 통해 변수들의 관계에 대한 쉽고 유용한 해석을 기대할 수 있다.
영문 초록
Generalized biplots (Gower, 1992) offer the visualization of the given data that allows both the continuous and categorical variables to be included. The algorithm of generalized biplots aims to visualize the dissimilarity of individual objects in low dimensional space. And the pseudo-points are used to represent the informations of the variables. But sometimes, it requires a long computation time for coordinates of the pseudo-points when the number of variables is large. Furthermore, it is difficult to interpret the relationship of variables due to the difference in the variation of the continuous and categorical variables. In this study, we will propose the mixed h-plot in order to interpret the relationship of variables in low dimensional space. The singular value decomposition for dimensional reduction is required the appropriate transformation for the given data. On the process, we also consider the difference in the variation of the continuous and categorical variables. Hence, we can expect that our proposed h-plot give clear and useful interpretation for the correlation of the continuous variables, the relevance of the categorical variables and the difference in the means of the continuous variables according to the levels of the categorical variable.
목차
1. 서론
2. 혼합자료에 대한 h-plot
3. 활용사례
4. 결론
References
해당간행물 수록 논문
- Sarmanov 분포를 이용한 이변량 포아송모형에 대한 추론
- Bayesian Estimation of Exponentiated Weibull SSPALT Model using Type-I Hybrid Censoring
- 쇼핑몰 특성이 고객만족 및 재방문 의도에 미치는 영향
- 개인의 성격속성이 위험기피도의 가상편의에 미치는 효과
- 통계청 생명표에 기초한 100세 이상 사망률 연장에 관한 연구
- The Role of Credit Default Swaps in the Korean Stock Market
- 타인의 정서적 피드백이 완벽주의자의 적응행동에 미치는 영향
- 전문계고 학생의 학교생활만족도가 취업 후 현재일자리 만족도에 미치는 영향에서 진로성숙도의 매개효과 검증
- 건강/수명 경로를 통한 의료비지출과 지역경제성장 관계에 대한 실증적 분석
- 균형계통추출과 회귀추정법을 이용한 모평균 추정
- 행사가격별 KOSPI200옵션 내재변동성의 정보효과
- 간호대학생의 대인관계, 우울이 스마트폰 사용수준에 미치는 영향
- 사회적 자본 및 파트너특성이 공동기술개발성과에 미치는 영향
- Time-Varying Volatility Spillover between Gold Futures and Singapore Stock Markets: Implication of the Portfolio Management
- 무관질문 확률화응답기법을 이용한 민감한 속성에 대한 모비율의 구간추정
- 메르스 역학 자료를 이용한 감염 Susceptible-Infected-Removed 모형 구축
- Association Analysis between the Type of Institutional Investors and the Financial Investment Behaviors
- 대학생의 전공계열별 스트레스 인지와 대처, 대학생활 적응의 관계
- 은행의 재무적 상황이 주택담보대출의 변화에 미치는 영향
- 중년여성의 삶의 질에 영향을 미치는 요인
- 재무곤경위험과 주식수익률
- 암환자를 돌보는 간호사의 직무 스트레스와 공감능력이 소진에 미치는 영향
- 복합 포아송 분포를 이용한 0과 양수값이 혼재된 강수자료 분석
- 연관성 규칙 관점에서 수정된 헬링거 측도의 제안
- 청소년 비만에 영향을 미치는 개인수준과 학교수준 요인의 효과
- 연관성 분석에서 표준화 향상도의 개선 방안 연구
- 초등학교 고학년 학생의 인터넷 과다사용에 영향을 미치는 요인
- 연령별 출산율 적합을 위한 모수적 모형에 대한 연구
- 좌우 화살표로 구성된 복합자극에 대한 전역
- 남자대학생의 음주결과기대, 대인관계능력 및 우울이 문제음주에 미치는 영향
- 연속형과 범주형의 혼합자료에 대한 혼합형 h-plot
- 남녀 음주자들의 음주 양가감정과 음주행동 및 문제의 관계에서 음주억제의 매개효과
- Threshold Models for Count Time Series: Case Study
- Authentic Experience and Consumer Responses in Ethnic Restaurants: The Expectation-Confirmation Perspective
- Generalized Partially Linear Single-index Model for Analysis of the Prevalence of Korean Type 2 Diabetes
- SUR을 활용한 노후대비 재무수단별 가입 결정요인
- The Nexus between Financial Status of Credit Card Business and Macro Economic Factors: Evidence from Korean Credit Card Firms
- 제임스-스타인 추정량을 이용한 부대 사격 명중률의 추정 방법
- 현금흐름과 할인율에 의한 주식 수익률의 분해
- 협력적 필터링에서 순위일치도 향상을 위한 결측치 대체 방법
- 노인의 구강건강관련 삶의 질에 영향을 미치는 요인
- 우리나라 중·고등학교의 교육프로그램 및 교육재정 투입 효과 검증
- Binary Forecast of Haze over Busan
- 텍스트마이닝을 활용한 연준의 통화정책방향 의결문 분석
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!