학술논문
주기도의 상관성을 이용한 시계열자료의 군집분석
이용수 75
- 영문명
- Time-series Data Clustering Based on the Correlation of Periodogram
- 발행기관
- 한국자료분석학회
- 저자명
- 권수현(Suhyun Kwon) 박만식(Man Sik Park)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.22 No.5, 1751~1766쪽, 전체 16쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2020.10.30
4,720원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
시계열 자료를 군집화할 때, 시계열의 계열수가 많은 경우에는 자료의 특성이 유사한 시계열들을 군집화한 후 이를 사전정보로 활용하여 모형설정 및 예측을 수행한다면 훨씬 효율적일 것이다. 시계열 자료의 군집분석 방법에는 다양한 거리가 정의될 수 있으며, 크게 두 가지로 구분한다. 첫째는 시간영역(time domain)에서의 분석으로, 시계열 자료의 특성인 자기상관함수(auto-correlation function), 부분(partial)자기상관함수로부터 거리(distance)를 정의하는 방법이다. 둘째는 주파수영역(frequency domain)에서의 분석으로, 표본 자기공분산함수(sample auto-covariance function)를 통해 얻어지는 주기도(periodogram)를 이용하여 거리를 정의하는 방법이다. 본 연구에서는 스펙트럼 밀도함수(spectral density function)의 추정량인 주기도 간의 상관성(association)에 근거한 거리를 제안하였다. 먼저 기존에 시계열 자료를 그룹화하는 데 사용된 거리들을 간략히 소개하고, 주기도 간의 상관관계로부터 거리를 제안하여 모의실험을 통해 성능을 비교하였다. 또한, 1990년 1월부터 2015년 4월까지 전국 월별 제조업생산지수 자료를 대상으로 기존의 거리와 본 연구에서 제안한 거리를 이용하여 산업 간의 군집화를 시도하였다.
영문 초록
The main goal of clustering time-series data is to clarify how similarity between time-series can be measured. There are two different approaches for identifying the similarity. The first approach focuses on the distances based on autocorrelation function and partial autocorrelation function inherent in given time-series measurements. The distances between estimated parameters under ARIMA model are also proposed. The second approach considers the time series clustering based on the estimator of spectral densisty function named periodogram and its transformations realized in the frequency domain. In this papar, we propose the metrics based on relationships between (smoothed) periodograms for the time-series data classification. The proposal is based on Pearson’s correlation and intra-class correlation. We evaluated the similarity metrics of our interest via three different simulation scenarios. A real-data analysis with 24 Korea manufacturing production indices data is also presented.
목차
1. 서론
2. 유사성 거리 척도
3. 모의실험
4. 실증연구
5. 결론
References
키워드
해당간행물 수록 논문
- 2020년 국회의원 선거 기간의 유튜브 빅데이터 분석
- 범죄자 프로파일링을 위한 존속 살인 연구
- OECD 자료를 활용한 상속세가 민간투자와 경제성장률에 미치는 영향 분석
- 적응집락추출에 의한 보정추정에 대한 연구
- 치매 발병 여부 예측을 위한 통계적 모형 및 기계학습 기반 기법 적용에 관한 연구
- 간호대학생의 문화적 역량과 윤리적 민감성이 간호전문직관에 미치는 영향
- 동료 튜터링을 통한 사회정서역량 및 대학생 핵심역량 향상도 분석
- 소매업체의 옴니채널 서비스가 고객경험 및 고객충성도에 미치는 영향
- 주기도의 상관성을 이용한 시계열자료의 군집분석
- 머신러닝을 활용한 계절 시계열 예측
- 데이터마이닝과 통계적 기법에 의한 대학의 취업 및 진로 만족도에 대한 순차적 분석
- 코로나-19 상황에서의 심리적 수용과 의도적 반추의 매개효과
- 편마비 환자의 수면의 질, 사회적지지, 낙상효능감이 우울에 미치는 영향
- 우리나라 4대 도시의 인구이동과 수렴속도의 관계에 대한 실증분석
- 지지면과 욕창 단계에 따른 경계압력 차이
- LSTM 기반 모형의 주식시장 예측성 분석
- 아마추어 골퍼의 라이 변화가 샷에 미치는 영향
- 오픈 데이터와 격자 시스템을 이용한 세종시 실제 인구 추정
- 국내 이직 관련 질적 연구 및 빅데이터 연구에서 나타난 이직 선행요인에 대한 종합적 검증
- Forecasting Method for PM10 Concentrations in Seoul, with Adjustments for the Count Time Series Distribution and Excess Zeros
- 성격평가질문지 증보판 반응왜곡지표의 상대적 효율성 비교
- Piecewise Logistic Regression for Cluster Randomized Controlled Trial of Health System Interventions
- Demand Systems of Private Tutoring in South Korea
- 제주지역 정보화마을 자립 및 활성화 요인 분석
- 인라인 스케이트 클럽의 서비스스케이프가 서비스 만족과 재구매의도에 미치는 영향
- 버퍼거리에 따른 공간 랜덤포레스트를 이용한 월 평균기온 예측 성능 비교
- 중학교 국어교과서에 제시된 글의 장르 특성 비교 분석
- 코로나 19 전·후의 대학생 체육활동이 역량변화에 관한 연구
- 유럽 탄소배출권 시장과 에너지 시장 사이의 변동성전이
- 기업경기실사지수를 이용한 경기인식의 비대칭성 분석
- 사회적기업 직원들의 개인-조직 그리고 개인-직무 적합성 인식이 직무태도에 미치는 영향
- 상사의 비인격적 감독과 고객의 불량 행동이 카지노 종사원들의 감정노동을 매개로 직무소진에 미치는 영향
- 대학 인재상을 반영한 대학생 인성역량 평가지표 개발
- 자본 및 유동성 위험수준이 은행의 위험감수행위에 미치는 영향에 관한 연구
- SAMC 알고리즘을 이용한 미디어 패널 개인화 추천 알고리즘
- 가우시안 반응 모형을 활용한 정준대응분석 고찰
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!