학술논문
양적·질적 혼합형 데이터에 대한 군집분석 알고리즘 비교 및 사례분석
이용수 119
- 영문명
- A Comparison and Case Study of Cluster Algorithms for Mixed Data with Quantitative and Qualitative Variables
- 발행기관
- 한국자료분석학회
- 저자명
- 배영준(Young-Jun Bae) 강현철(Hyuncheol Kang) 연규필(Kyupil Yeon) 권은미(Eun-Mi Gwon) 한상태(Sang-Tae Han)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.17 No.6, 2991~3002쪽, 전체 12쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2015.12.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
군집분석은(cluster analysis)은 군집의 개수나 구조에 관한 특별한 가정 없이 개체들 사이의 유사성 또는 거리(비유사성)에 근거하여 자연스러운 군집을 찾고 다음 단계의 분석을 꾀하는 탐색적인 통계분석 기법이다. 전통적인 거리-기반 군집분석에서는 양적(연속형) 데이터가 주로 사용된다. 그러나 질적(범주형) 데이터가 포함되어 있는 데이터에 대해서 군집분석을 수행하고자 하는 경우도 자주 발생한다. 특히 데이터마이닝과 같은 분야에서는 인구사회적 특성이나 거래 속성 등의 질적 변수를 포함하여 분석해야 하는 경우가 매우 많다. 본 연구에서는 양적·질적 변수들이 혼합되어 있는 데이터에 대하여 가장 널리 사용되는 군집분석 알고리즘들을 비교하였다. 여기에서 다루는 알고리즘은 거리에 기초한 SAS/Enterprise Miner의 k-평균 군집화, 확률분포에 기초한 SPSS의 2-단계(two-step) 군집화, 혼합모형에 기초한 Latent GOLD의 LCA(latent class analysis) 방법이다. 본 연구의 사례분석 결과에서도 볼 수 있듯이 동일한 데이터에 대하여도 사뭇 다른 결과를 산출한다. 따라서 실제 문제에서 연구자들은 한 가지 방법만으로 결과를 도출하지 말고, 다양한 방법들을 사용하여 결과를 얻고 그들을 서로 비교하여 가장 합리적인 결과를 얻을 수 있도록 노력할 필요가 있다.
영문 초록
Cluster analysis is an exploratory statistical method to search significant structures inherent in a given data set based on similarity or distance among observations. Conventional clustering algorithms are applied to mostly quantitative variables for which a distance can be defined naturally. However, in many application fields we are often confronted with a mixed data set which contains qualitative variables as well as continuous variables. In this study, we compare some clustering methods which are commonly used for such a mixed data by conducting simulations with real data sets. The clustering methods we consider are k-means clustering, two-step clustering and latent class analysis method which can be easily implemented using statistical softwares such as SAS/E-miner, SPSS and Latent GOLD. The comparative simulation results can be helpful to practical researchers considering a cluster analysis with a mixed numeric and categorical data set.
목차
1. 서론
2. SAS/Enterprise Miner의 k-평균 군집분석
3. SPSS의 2-단계 군집분석
4. Latent GOLD의 LCA 방법
5. 논의 및 결론
References
키워드
해당간행물 수록 논문
- 한국 수출제품의 PPL 광고효과에 따른 소비경험과 가치일치성의 구조적 관계 연구
- 간호학생의 메타인지, 학습유형, 내외통제성 및 자존감
- 한국 신용부도스왑 스프레드의 가격행위
- 본원적 경쟁전략과 기업가치의 관계에 대한 산업별 분석
- 로지스틱 회귀모형을 이용한 장기요양보험 등급판정위원회 등급결정 지표 연구
- Lotka-Volterra 모형을 이용한 스마트폰 시장의 경쟁관계 분석
- 협업필터링에서 사전평가 방법을 이용한 이웃선정의 예측 성능 개선
- 미국 헬스케어 오픈 데이터 기업의 에고 네트워크 분석
- 해양스포츠 참가자의 참여동기와 운동정서가 심리적 행복감에 미치는 영향
- 한국인의 흡연과 심혈관 및 폐질환 위험에 관한 횡단면 연구
- 프랙탈 이미지의 복잡성, 색의 유무와 아름다움 지각의 관계
- 낮은 현금기준 이자보상배율이 영업이익의 가치관련성에 미치는 영향
- 소프트웨어 결함 자료에서 소프트웨어 신뢰성 모형과 비선형 회귀곡선의 비교
- Depressive Symptom Cluster and Suicide Ideation
- The Impact Factors on Broadcasting Production Staff’s Burnout
- A Study on Imputation for Missing Data using the Kriging
- A Study on the Effect of Corporate Governance on Corporate Performance and Market Evaluation
- 메타인지 수준에 따른 학습팀 구성방식이 간호대학생의 팀-구성원 교환관계와 문제해결능력에 미치는 영향
- 국내 유동성 결정요인 분석: 통화정책의 유동성증대 효과를 중심으로
- Examining the Influence of Familiarity and its Paradoxical Effect on Service Failure Memory
- 분산 베이지안 추론방법과 가우시안 확률과정 분류모형을 이용한 다차원 자료의 분류
- 초등학생의 스트레스 대처행동 영향 요인
- 데이터마이닝 기법을 이용한 소득 수준별 가계부채총액 예측모형 구축
- 다중회귀분석에서 설명변수의 상대적 중요도 지표에 관한 연구
- 남자간호대학생의 전공만족도에 미치는 영향요인
- 부모의 외모관련 양육 태도와 사회문화적 태도가 아동의 신체존중감과 외모만족도에 미치는 영향
- 우리나라 청소년의 수면시간의 영향요인 예측연구
- 퇴원손상심층조사 자료를 이용한 최근 7년간의 전립선암 환자분석
- 공정관광 인식 및 신뢰가 만족 및 행동의도에 미치는 영향
- 세분화된 고객별 신용평점모형의 개발
- 로지스틱 회귀 모형을 이용한 연관성 규칙 채택률의 추정
- 고객의 상품경험의 다양성과 상품선택의 대중성이 추천시스템에 미치는 영향
- 관문경관 평가 지표에 의한 도시 이미지 특화방안
- 양적·질적 혼합형 데이터에 대한 군집분석 알고리즘 비교 및 사례분석
- Prediction of the Hazard Rate of CTX s First Occurrence
- Reinvestigating the Delayed Overshooting Puzzle Using Simultaneous Confidence Regions
- Comparing the Power of Several Tests about Specific Populations
- 도덕성 수준과 정신적 오염이 정화욕구 증가에 미치는 영향
- 경기도와 충청도 제조업의 기술적 효율성과 집적경제
- 준연속형 비율자료를 반응변수로 갖는 회귀모형
- 조직의 공정성이 경영진에 대한 신뢰에 미치는 영향
- 통계적 결합의 정확성 연구
- Factors Influencing Intention to Perform Bystander Cardiopulmonary Resuscitation Among Adults Dwelling in B City
- 선거여론조사에 가중치가 미치는 영향분석
- 부산시 산복도로 르네상스 마을만들기 사업의 추진주체별 역할 중요도 분석을 통한 지역주민 공동체 육성 방안
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!