본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

모든 주변비율을 고려한 확률적 흥미도 측도 기반유사성 측도의 한계 설정에 관한 연구

이용수 0

영문명
A Study on the Bounds of PIM based Similarity Measures with AMP
발행기관
한국자료분석학회
저자명
박희창(Hee-Chang Park)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.17 No.4, 1839~1847쪽, 전체 9쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2015.08.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

군집분석은 현업에서 많이 활용되고 있는 데이터 마이닝 기법 중의 하나로 다양한 특성을 내포하고 있는 엄청난 크기의 데이터 집단을 아무런 가정 없이 유사성 측도만을 이용하여 데이터베이스에 포함되어 있는 객체를 비슷한 군으로 묶는 기법이다. 본 논문에서는 유사성의 정도와 방향을 동시에 나타내주는 확률적 흥미도 측도 기반 유사성 측도들 중에서 모든 주변 비율을 고려한 측도들에 대해 대소 관계를 수학적으로 규명하는 동시에 실제 데이터와 모의실험 데이터를 이용하여 좀 더 구체적으로 측도들 간의 관계를 살펴보았다. 실제 데이터를 분석한 결과, SCohen, SMP, SPhi, 그리고 SFleiss는 PIM과 동일한 부호를 가지는 반면에 Sphi의 제곱인 SDoo는 모든 경우에 양의 값으로 나타났다. 또한 측도들의 절대값의 크기를 오름차순으로 정리하면 SDoo, SCohen, SMP, SPhi,SFleiss 의 순으로 나타나는 사실을 수학적으로 증명하였다. 모의실험을 통해 SDooSCohen의 대소 관계를 좀 더 구체적으로 알아본 결과, SDoo를 제외한 모든 측도들이 PIM과 동일한 부호를 가지는 것을 알 수 있으며, PIM이 양의 값을 갖는 경우 각 측도들의 절대값의 크기는 SDoo, SCohen, SMP, SPhi, SFleiss의 순으로 나타났다. 그러나 PIM이 음인 경우 동일 방향 빈도에 비해 반대 방향 빈도가 현격하게 크게 되면 SDoo와 의 SCohen순위가 뒤바뀐다는 사실을 확인하였다.

영문 초록

Cluster analysis is one of many data mining techniques that are utilized in the work site operations. By Wikipedia, it is the task of grouping a set of objects in such a way that objects in the same group are more similar to each other than to those in other groups. In this paper, we computed bounds for similarity measures based on the probabilistic interestingness measure with all marginal probability, and compared these measures by real data and simulated experiment. The results are as follows : (1) SCohen, SMP, SPhi, and SFleiss have the same sign with PIM, but SDoo has a positive value in all cases. (2) If PIM has a positive value, the ascending order of the absolute values is SDoo, SCohen, SMP, SPhi, and SFleiss. (3) If PIM has a negative value, and the product of the frequencies in the opposite direction is significantly larger than that in the same direction, the ascending order is SDoo, SCohen, SMP, SPhi, and SFleiss. From these results, we confirmed that the bounds of similarity measures provided means of classifying various measures.

목차

1. 서론
2. 주변비율 전부를 고려한 PIM 기반 측도들의 대소 관계
3. 사례를 통한 대소 관계 탐색
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

박희창(Hee-Chang Park). (2015).모든 주변비율을 고려한 확률적 흥미도 측도 기반유사성 측도의 한계 설정에 관한 연구. Journal of The Korean Data Analysis Society (JKDAS), 17 (4), 1839-1847

MLA

박희창(Hee-Chang Park). "모든 주변비율을 고려한 확률적 흥미도 측도 기반유사성 측도의 한계 설정에 관한 연구." Journal of The Korean Data Analysis Society (JKDAS), 17.4(2015): 1839-1847

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제