본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

항목의 상대적 발생 비율을 고려한 연관성 평가 기준 활용 방안

이용수 0

영문명
Utilization of Association Rule Thresholds Considering Relative Occurrence Rates
발행기관
한국자료분석학회
저자명
박희창(Hee-Chang Park)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.14 No.4, 1861~1870쪽, 전체 10쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2012.08.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

오늘날 정보기술이 급속도로 발전함에 따라 다양한 데이터 마이닝 기법들이 마케팅, 소매업, 제조업, 금융 및 보험업, 보건 및 의학, 이미지 분석 등 여러 분야에서 적용되고 있다. 이들 중에서 가장 많이 연구되고 있는 연관성 규칙은 거대한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 탐색하는 데 활용되고 있다. 일반적인 연관성 규칙 생성과정은 먼저 사용자가 지정한 최소 지지도의 조건을 만족하는 빈발항목집합을 생성한 후, 생성된 빈발항목집합에 대해 최저 신뢰도의 조건을 만족하는 규칙을 연관성 규칙으로 채택한다. 이 때 항목 발생 비율이 매우 작은 경우에는 빈발항목집합에 포함될 가능성이 매우 희박하기 때문에 신뢰도의 값이 매우 크다고 할지라도 연관성 규칙으로 채택되지 않는다. 이를 개선하기 위해 본 논문에서는 항목의 상대적 발생 비율을 고려한 연관성 규칙 평가 기준을 제안하였으며, 예제를 통하여 이들 평가 기준의 유용성을 살펴보았다. 그 결과, 상대적 발생 비율의 값이 클수록 본 논문에서 제안한 지지도와 신뢰도가 기존의 연관성 규칙을 적용한 경우 보다 크게 나타나기 때문에 발생 비율이 작은 항목들 간의 연관성 규칙들도 생성할 수 있었으며, 발생 비율이 다른 항목들 간의 연관성 규칙들을 합리적이고도 공정하게 비교할 수 있다는 사실도 확인하였다.

영문 초록

Data mining is a method to find useful information for large amounts of data in database. It is used to find hidden knowledge by massive data, unexpectedly pattern, relation to new rule. The methods of data mining are decision tree, association rules, clustering, neural network and so on. Association rule mining searches for interesting relationships among items in a given large data set, and has been applied in various fields like market basket analysis, finance, manufacturing control, health and medical science, insurance, image analysis, and internet shopping mall. There are three primary quality measures for meaningful association rules; support, confidence, and lift. In this paper, we propose some association thresholds considering relative occurrence rates for association rule exploration of rare cases. The comparative studies with two kinds of supports and confidences are shown by numerical example. As a result, the higher the relative occurrence rates, the values of support and confidence considering relative occurrence rates are greater than the existing support and confidence.

목차

1. 서론
2. 상대적 발생 비율을 고려한 연관성 평가 기준
3. 예제를 통한 유용성 고찰
4. 결론
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

박희창(Hee-Chang Park). (2012).항목의 상대적 발생 비율을 고려한 연관성 평가 기준 활용 방안. Journal of The Korean Data Analysis Society (JKDAS), 14 (4), 1861-1870

MLA

박희창(Hee-Chang Park). "항목의 상대적 발생 비율을 고려한 연관성 평가 기준 활용 방안." Journal of The Korean Data Analysis Society (JKDAS), 14.4(2012): 1861-1870

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제