학술논문
히스토그램 자료를 위한 성긴 k-평균 군집분석에 관한 연구
이용수 0
- 영문명
- A study on sparse k-means clustering for histogram-valued data
- 발행기관
- 한국자료분석학회
- 저자명
- 서보배(Bo Bae Seo) 윤영주(Young Joo Yoon)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.26 No.5, 1317~1329쪽, 전체 13쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2024.10.31
4,360원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 논문에서는 대표적인 심볼릭 데이터(symbolic data)인 히스토그램 자료를 위한 성긴 k-평균군집분석에 대해 연구하였다. p차원 히스토그램 자료를 군집화하기 위하여 히스토그램 자료간의 거리를 Wasserstein-Kantorovich 거리를 이용하여 측정하고 p개의 변수에 성긴 k-평균 군집분석(sparse k-means clustering) 알고리즘을 적용하여 변수별 가중치를 구하고 이를 이용하여 군집 결과를 얻는다. 이 방법은 가중치를 적용한 군집간 거리 제곱합을 최대로 하는 가중치를 찾는 군집방법이다. 여러 다른 군집 수에 대하여 성긴 k-평균 군집 알고리즘을 적용하고 실루엣(Silhouette) 측도를 이용하여 이 측도가 최대가 되는 군집 개수를 적정한 군집 개수로 결정한다. 성긴 k-평균 군집분석의 성능을 확인하기 위해 여러 분포에 대해 자료를 생성하여 모의실험을 실시하여 군집의 일치도와 선택되는 변수의 측면에서 k-평균 군집분석과 비교를 하였고 미국의 48개 주 월별 평균 기온자료를 이용해 실제 자료 분석을 실시하였다. 그 결과 제안된 방법은 군집에 필요한 변수를 잘 선택하면서도 군집의 일치도 측면에서 좋은 성능을 보였으며 실제 자료분석에서도 적절한 분석 결과를 보였다.
영문 초록
In this paper, we investigate a sparse k-means clustering method for histogram-valued data. The distances between histogram-valued observations are defined using the Wasserstein-Kantorovich distances to group p-dimensional histogram-valued data. Clustering is performed using the sparse k-means clustering method with the distance matrix computed for each dimension. The proposed method maximizes the weighted sums of squared distances between clusters. For various value of k, we apply the sparse k-means clustering method and determine the optimal number of clusters with the Silhouette measure. Simulation studies were conducted to compare the proposed method with the standard k-means clustering method in terms of cluster agreement and selected variables. Additionally, we analyzed real data from the monthly average temperatures of 48 US states. As a result of numerical analysis, it was confirmed that the proposed method shows superior performance and effective variable selection.
목차
1. 서론
2. 이론적 배경
3. 히스토그램 자료에 대한 성긴 k-평균 군집분석
4. 모의실험 및 자료분석
5. 결론
References
키워드
해당간행물 수록 논문
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.5 Contents
- Joint Modeling of Multi-Scale Stock Price using Hierarchical Hidden Markov Models
- 머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측
- 대학 재학생들의 중도탈락 패턴 분석 및 이탈 예측: H 대학교를 중심으로
- 자율주행 차량 사고 원인 분석을 통한 안전성 제고 방안
- 문자중계와 몬테카를로 시뮬레이션 기반 배구 경기 승패 예측에 관한 연구
- 히스토그램 자료를 위한 성긴 k-평균 군집분석에 관한 연구
- 학습기에 따른 부스팅 성능 비교
- 의사결정나무 분석에 대한 국내 연구 동향 탐색
- 주식시장 수익률과 개인 투자자의 매매 성향
- 동태적 관점에서 본 환경정책과 생산성의 관계: 제조업을 중심으로
- DEA와 SFA 모형을 이용한 한국 프로야구의 비용효율성 분석
- 빅데이터를 활용한 소셜미디어 기후변화 회의론 네트워크와 인플루언서 메시지 구조 분석: 사회연결망 분석과 의미연결망 분석의 적용
- 축제 방문 동기에 따른 축제방문객 시장세분화 연구: 설악문화제 중심으로
- 투자심리와 주식 유동성 간의 관계
- 시니어 창업의 내·외적 동기가 창업의지와 창업행동에 미치는 영향
- 온라인 수업을 경험한 간호대학생의 학습몰입과 문제해결능력이 학업성취도에 미치는 영향
- 신규간호사의 임상수행능력에 영향을 미치는 요인
- 국내 간호대학생의 임상수행능력 관련 변인에 대한 체계적 문헌고찰 및 메타분석
- 스크린 골프 이용자의 수준별 경기력 비교 분석 및 스코어 예측
- 자율주행 자동화 수준과 도로형태에 따른 이차과제 수행과 상황인식 차이
- 자원 희소성(resource scarcity)이 자기 효능감에 미치는 영향: 지각된 통제감의 매개효과
- 댓글분석을 활용한 사이코패스 인식: 웹크롤링과 LDA를 중심으로
- 법적 판단에서의 증거평가 차원: 다차원 척도법 및 펴기의 적용
- 대학생의 디지털 리터러시 변화에 대한 종단연구: 잠재성장모형을 적용하여
참고문헌
관련논문
자연과학 > 통계학분야 BEST
더보기자연과학 > 통계학분야 NEW
- Joint Modeling of Multi-Scale Stock Price using Hierarchical Hidden Markov Models
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.5 Contents
- 머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!