본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

상대적 발생/비발생 비율을 고려한 연관성 평가 기준의 모형 개발

이용수 0

영문명
A Proposition of Association Rule Thresholds Considering Relative Occurrence/Nonoccurrence Rates
발행기관
한국자료분석학회
저자명
박희창(Hee-Chang Park)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.15 No.4, 1841~1850쪽, 전체 10쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2013.08.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

오늘날 빅 데이터 시대를 맞이하여 엄청난 규모의 데이터베이스 안에서 유용한 정보를 찾아내 주는 데이터 마이닝 기술이 주목받고 있다. 데이터 마이닝 기법 중에서 가장 많이 연구되고 있는 연관성 규칙은 지지도, 신뢰도, 그리고 향상도를 기반으로 하여 거대한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 탐색하는 데 활용되고 있다. 연관성 규칙을 생성하고자하는 경우 먼저 사용자가 지정한 최소 지지도의 조건을 만족하는 빈발항목집합을 생성한 후, 생성된 빈발항목집합에 대해 최저 신뢰도의 조건을 만족하는 규칙을 연관성 규칙으로 채택한다. 이 때 항목 발생 비율이 매우 작은 경우에는 빈발항목집합에 포함될 가능성이 매우 희박하기 때문에 신뢰도의 값이 매우 크다고 할지라도 연관성 규칙으로 채택되지 않는다. 이를 위해 본 논문에서는 항목의 상대적 발생 및 비발생 비율을 동시에 고려한 연관성 규칙 평가 모형을 제안하고, 예제를 이용하여 기존의 연관성 평가 기준과 비교하였다. 그 결과, 그 결과, 동시발생빈도의 값이 증가함에 따라 본 논문에서 제안한 연관성 평가 기준 모두가 증가하는 것으로 나타났다. 또한 지지도와 신뢰도의 값들도 기존의 것들 보다 더 큰 값을 가지므로 사용자가 지정한 최소지지도와 신뢰도의 조건을 만족하는 규칙으로 채택될 가능성이 가장 큰 것으로 나타났다.

영문 초록

Big data is a collection of large data sets that it becomes difficult to process using traditional data processing applications. Data mining is drawing attention in the big data era. It is a method to find useful information for huge amounts of data in database. The techniques of data mining are association rules, decision tree, clustering, neural network and so on. Association rule technique searches for interesting relationships among items in a given large data set, and has been applied in various fields like internet shopping mall, finance, health and medical science, insurance, image analysis, and manufacturing control. There are three primary quality measures for meaningful association rules; support, confidence, and lift. In this paper, we propose some association thresholds considering relative occurrence and nonoccurrence rates for association rule exploration of rare cases. The comparative studies with several kinds of supports and confidences are shown by numerical example. As a result, the higher the simultaneous occurrence frequency, the values of support and confidence considering relative occurrence and nonoccurrence rates are greater than the existing supports and confidences.

목차

1. 서론
2. 상대적 발생/비발생 비율을 고려한 연관성 평가 기준
3. 적용 예제
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

박희창(Hee-Chang Park). (2013).상대적 발생/비발생 비율을 고려한 연관성 평가 기준의 모형 개발. Journal of The Korean Data Analysis Society (JKDAS), 15 (4), 1841-1850

MLA

박희창(Hee-Chang Park). "상대적 발생/비발생 비율을 고려한 연관성 평가 기준의 모형 개발." Journal of The Korean Data Analysis Society (JKDAS), 15.4(2013): 1841-1850

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제