학술논문
정규혼합모형의 대용량자료 적합을 위한 일반화 Incremental EM 알고리즘에 대한 연구
이용수 6
- 영문명
- A Generalized Increment EM algorithm for fitting Normal Mixture Model in Large Data Set
- 발행기관
- 한국자료분석학회
- 저자명
- 김승구(Seung-Gu Kim)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.6 No.4, 1031~1042쪽, 전체 12쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2004.08.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
IEM(Incremental EM) 알고리즘은 자료의 개수가 매우 클 때 정규혼합모형을 추정하기 위해 자주 사용된다. 이 알고리즘은 자료를 여러 개의 블록으로 분할한 후 각 집단에 대해 부분 E-단계를 처리하는 기법으로서, 자료의 크기 때문에 발생하는 EM의 비실현성 문제를 해결할 뿐만 아니라 알고리즘 자체의 수렴속도를 향상시킨다. 그러나 많은 응용문제에서 자료 블록이 고정되어 있고 또 블록의 개수가 매우 큰 경우가 자주 나타난다. 이 경우 IEM 알고리즘 역시 실현성의 문제점이 발생한다. 이 문제를 해결하기 위해 본 연구에서는 블록 집합 크기의 구성을 통해 EM알고리즘 뿐 아니라 IEM 알고리즘을 포함하는 보다 일반화된 알고리즘을 제안한다. r차-IEM알고리즘이라 부르는 이 알고리즘을 통해 블록의 개수가 매우 클 때 최대 로그-우도값에 도달하는 처리시간이 EM이나 IEM 알고리즘보다 더 짧은 차수 r이 존재함을 모의실험을 통해 보였다.
영문 초록
The IEM(Incremental Expectation Maximization) algorithm is frequently used to fit normal mixture model when data sets are large. For the algorithm, dataset underlying is divided into several blocks available and the partial E-step performs for each block. However, this method still suffers inefficiency of cpu time for the case in which the numbers of blocks are fixed and large. In this paper, an algorithm so called the rth-ordered IEM algorithm is proposed which provides a general form in a sense that it constructs a class of IEM algorithms with the size of block sets. With the rth-ordered IEM, when the size of block set are large we find that there exists the order(say r) such that it has a less arrival time to maximum of the log-likelihood than those of the EM and the IEM algorithm through a simulation study.
목차
1. 서론
2. IEM 알고리즘과 문제제기
3. 제안된 IEM 알고리즘
4. 모의실험
5. 결론
참고문헌
해당간행물 수록 논문
- 고등학교 검정교과서 실용수학의 생활통계 단원에 대한 비교 연구
- 외환위기 전후 한국기업의 자본구조와 그 결정요인의 변화
- 퍼지이론의 통계적 응용을 위한 교과목 연구
- Comparative Studies of the Reliability Estimation for a Circular Consecutive-r-out-of-k:F System with Rayleigh Lifetime Distribution
- 한국선물시장의 수익률과 변동성에 대한 장기기억 특성
- A Bayesian Method for Gene Selection in the Weibull Survival Model with Application to DNA Microarray Data
- Robust Least Squares Support Vector Machine
- 월경통에 대한 통계적 측도의 개발에 관한 연구
- The Confidence Intervals for the Variances Ratio
- System Reliability from Common Random Stress in a Type II Bivariate Pareto Model with Random Censored Data
- Census 자료에 의한 국내인구이동
- DNA Microarray 발현정보에 대한 고찰 및 통계적 분석방법 소개
- 정치 웹사이트의 아웃링크 데이터를 이용한 네트워크 분석
- On the Availability of Mobile Phone Survey
- GIS를 이용한 국내 유통 할인점에 대한 공간분석
- 와이블 수명분포를 갖는 원형 연속 k-중-r: F 시스템의 신뢰도 추정에 관한 비교연구
- AHP 자료분석 기법을 이용한 인터랙티브 영상컨텐츠 산업육성 전략
- 로지스틱 회귀모형을 이용한 채택확률모형
- Bayes Estimation of the Stress-Strength Model Reliability When the Mean Strength Is Greater Than the Mean Stress
- 개인화를 위한 추천시스템 알고리즘에 관한 연구
- 센텀시티 UEC의 경제적 파급효과 분석
- 정규혼합모형의 대용량자료 적합을 위한 일반화 Incremental EM 알고리즘에 대한 연구
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!