본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

연관성 규칙 수의 결정을 위한 비선형 회귀모형에서의 표준화 향상도 적용 방안

이용수 0

영문명
Development of Regression Models by Standardized Lift for Association Rule Number Estimation
발행기관
한국자료분석학회
저자명
박희창(Hee-Chang Park)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.16 No.5, 2447~2455쪽, 전체 9쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2014.10.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

다양한 종류의 대규모 데이터에 대한 수집과 분석을 그 특징으로 하는 빅 데이터는 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하며, 비즈니스적인 요구에 의해 시장에 등장한 데이터마이닝 기법은 각종 분야의 빅 데이터로부터 최적 전략이나 의사결정을 위해 많이 활용되고 있다. 본 논문에서는 연관성 규칙의 수를 추정하기 위한 기존의 연구에 이어 표준화 향상도를 적용한 회귀모형을 제안한 후, 이 모형과 기존의 회귀 모형과의 비교를 통해 그 유용성을 살펴보고자 한다. 이를 위해 각 모형에 대한 회귀계수를 추정하고, 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 적합도와 기여도를 비교하였으며, 이들을 토대로 가장 바람직한 회귀 모형을 구하였다. 그 결과, 분산분석에서의 통계량 값이 모든 유형에서 유의하게 나타난 반면에 기본적인 평가 기준에 의한 회귀모형에서는 향상도가 아무런 의미를 가지지 못했으나 표준화 향상도를 적용한 모형에서는 거의 대부분의 모형들이 지지도와 신뢰도뿐만 아니라 표준화 향상도도 유의미한 결과를 얻을 수 있었다. 따라서 기본적인 연관성 평가 기준을 사용하여 회귀모형을 구축할 때 보다 표준화 향상도를 고려하여 모형을 구축하게 되면 더 많은 평가 기준에 의해 연관성 규칙의 수를 설명할 수 있는 것으로 나타났다.

영문 초록

By Wikipedia, big data is an all-encompassing term for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications. We have used data mining technique for optimal decision making from big data. The most widely used data mining technique is to explore association rules. This technique has been used to find the relationship between each set of items based on the association thresholds such as support, confidence, lift, etc. Multiple regression analysis is an inherently statistical technique applicable to numerous data mining situations. In this paper, we proposed some non-linear regression equations between the number of rules and thresholds such as support, confidence, and standardized lift. And then we compared these models with regression models of elementary thresholds by variation inflation factor, F value, and adjusted coefficients of determination for exploration of the best model through some numerical experiments. The results show that the regression models considering standardized lift were better than those of original thresholds.

목차

1. 서론
2. 표준화 향상도에 의한 비선형 회귀 모형
3. 적용 예제
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

박희창(Hee-Chang Park). (2014).연관성 규칙 수의 결정을 위한 비선형 회귀모형에서의 표준화 향상도 적용 방안. Journal of The Korean Data Analysis Society (JKDAS), 16 (5), 2447-2455

MLA

박희창(Hee-Chang Park). "연관성 규칙 수의 결정을 위한 비선형 회귀모형에서의 표준화 향상도 적용 방안." Journal of The Korean Data Analysis Society (JKDAS), 16.5(2014): 2447-2455

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제