본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

재표본 방법을 이용한 군집화 불안정성 측정에 관한 연구

이용수 3

영문명
A Study on the Selection of Number of Clusters Using Resampling Techniques
발행기관
한국자료분석학회
저자명
백아현(AhHyun Baek) 이성건(Seong-Keon Lee)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.15 No.6, 3101~3109쪽, 전체 9쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2013.12.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

다변량 분석 중 군집분석(cluster analysis)은 주어진 관측개체를 몇 개의 군집으로 나눔으로써 군집을 이해하고 효율적으로 활용하기 위한 분석방법이다. 군집분석에서 군집의 적절한 개수를 추정하는 것은 중요한 문제이며 지금까지 많은 연구가 진행되어왔다. 군집의 개수를 결정하는 방법들의 대부분은 군집내의 제곱거리와 군집간의 제곱거리를 이용하는 것이다. 하지만 연구자의 주관적인 의견이 많이 반영되고 정확한 결과를 제공해주지 못한다는 문제점이 있다. 최근에는 군집내, 군집간의 거리개념을 넘어서 군집의 안정성에 관한 연구도 많이 진행되고 있다. 특히 군집화 불안정성을 최소화하는 군집개수를 최적의 군집개수로 결정하는 알고리즘들이 제안되었다(Wang, 2010; Fang, Wang, 2012). 본 연구에서는 기존의 방법을 개선하여 연관성측도로 군집화 불안정성을 측정하는 새로운 군집개수 결정 알고리즘을 제안하였다. 실제 데이터에 새로운 방법을 적용시킨 결과, 기존 방법보다 군집개수 결정에서 우수함을 확인할 수 있었다.

영문 초록

In cluster analysis, it is important to estimate the number of clusters. Many ways to determine the number of cluster have been proposed such as Calinski, Harabasz (1974), Hartigan (1975), Krzanowski, Lai (1985). Most of them are based on the between cluster and/or within-cluster sum of squared distances. Recently, researches on the stability of the clustering have been studied. It has been proposed to select the number of clusters as the one minimizing the clustering instability (Wang, 2010; Fang, Wang, 2012). Also, Wang (2010) and Fang, Wang (2012) developed an estimate scheme for clustering instability based on bootstrap and cross-validation. In this study, we define the clustering instability by using measure of association such as kappa coefficient, Jaccard coefficient, phi coefficient. The proposed methods are demonstrated on a variety of numerical experiments using the simulation and real data application. The simulation study and real application showed that the hit ratio of the proposed method is higher than the previous methods. As a result, we know that the methods using measures of association are competitive.

목차

1. 서론
2. 군집개수의 결정
3. 연관성측도를 이용한 군집개수의 결정
4. 실제 데이터의 적용
5. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

백아현(AhHyun Baek),이성건(Seong-Keon Lee). (2013).재표본 방법을 이용한 군집화 불안정성 측정에 관한 연구. Journal of The Korean Data Analysis Society (JKDAS), 15 (6), 3101-3109

MLA

백아현(AhHyun Baek),이성건(Seong-Keon Lee). "재표본 방법을 이용한 군집화 불안정성 측정에 관한 연구." Journal of The Korean Data Analysis Society (JKDAS), 15.6(2013): 3101-3109

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제