학술논문
불균형 시계열 자료를 위한 분류 알고리즘 적용방안
이용수 244
- 영문명
- Applications of the classification algorithm for unbalanced time series data: Focusing on the corporate default model
- 발행기관
- 한국자료분석학회
- 저자명
- 조용복(Yongbok Cho) 조동우(Dongwoo Cho) 최보승(Boseung Choi)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.24 No.2, 639~651쪽, 전체 13쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2022.04.30
4,360원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
기업 부도모형에 사용되는 데이터는 정상기업이 부도기업에 비해 압도적으로 많이 관측되는 대표적인 불균형 데이터이며, 과거 및 현재의 재무변수를 사용하여 부도 사건을 예측하는 시계열 데이터의 특성을 지니고 있다. 따라서 예측모형을 구축하는데 있어 이러한 데이터의 불균형 문제와 시계열적 특성의 반영에 각별한 주의가 필요하다. 본 연구는 부도 예측모형 구축과정에서 고려해야 하는 불균형 자료 해소와 시계열 자료의 특성이 반영된 모형 검증방안에 대한 비교연구를 진행하였다. 실증분석을 위해 한국거래소에 상장된 기업을 대상으로 부도모형을 구축하였고, 모형의 예측 성능을 비교분석 하였다. 이를 통하여 첫째, 학습데이터의 불균형 문제는 oversampling기법을 고려할 때 예측모형의 일반화 성능을 확보할 수 있음을 확인하였다. 하지만, oversampling기법 간의 성능 차이는 뚜렷하게 나타나지 않았다. 둘째, 일반적으로 많이 사용하는 k-fold 교차검증과 전진교차검증을 비교한 결과 시간의 흐름에 대한 고려 없이 추정된 모형을 사용하였을 때 그 예측 성과가 과대 추정될 수 있음을 확인하였고, 이를 통해 시계열 데이터에 대한 전진교차검증의 필요성을 보였다.
영문 초록
The data used in the corporate default model is imbalanced; observation of non-default is overwhelmingly more prominent than the default case. Additionally, the data also have the characteristics of time series, i.e., the default events in the future are predicted by lagged financial statements. Therefore, We must consider the characteristics of imbalanced and time-series in the modeling process for default events. In the paper, we studied the model process with imbalance problems and model validation for time-series. We conducted empirical analysis on corporates listed on the Korea Exchange to construct a default model and compared the prediction performance by applying various machine learning classification algorithms. First, we confirmed that the problem of imbalance in train data could secure the generalization performance of the prediction model only when the oversampling method is considered. However, there is no significant difference in predicting performance between the oversampling methods. Second, we compared the k-fold cross-validation and time-series cross-validation. Moreover, we confirmed that the model could overestimate prediction performance without considering a timely manner. Thus, We confirmed the necessity of time-series cross-validation for the classification model using the time series data.
목차
1. 서론
2. 불균형 시계열 데이터 처리 기법
3. 데이터 및 연구 방법
4. 실험 결과
5. 결론
References
키워드
해당간행물 수록 논문
- Journal of The Korean Data Analysis Society Vol.24 No.2 목차
- 시가변적 모수의 동태적 요인 모형을 이용한 아시아 지역의 경기 동조성에 관한 연구
- G시 공무원의 치매인식과 치매두려움이 치매태도에 미치는 영향
- 보험회사의 수익구조에 따른 차별적 이익품질에 관한 연구
- A Research on Corporate Governance, Capital Structure, Default Risk, and Performance
- 겨울철 일 단위 노면온도 패턴에 대한 군집분석
- 에너지 소비와 경제성장의 동태적 관계에 관한 분석
- Financial Crisis and the Payout Policy under Asymmetric Information
- COVID-19의 치사율에 대한 사회·경제적 요인 및 이동성 결정요인 분석
- VARX 모형을 활용한 제주 지역 가계부채 관련 정책의 실물경제 효과 분석 및 예측*
- 내부 기업지배구조가 경영성과와 기업가치에 미치는 효과
- Dimension Reduction and Classification with Weighted Supervised PCA
- 농촌태양광 이슈에 대한 소셜미디어 게시글과 이용자 댓글 분석
- 다섯수치요약 정보에 근거한 정규모집단의 모수 추정에 관한 연구
- 분수 다항식 모형을 이용한 최저임금 변화의 창업에 대한 효과 분석
- 잠재토픽모형을 이용한 이미지 군집화에 대한 연구
- 소비자중심적 경영활동이 기업의 재무성과 및 ESG에 미치는 영향
- 비만 분류를 위한 인체 변수 선택 및 분류 방법에 대한 연구
- 공변량의 측정오차를 고려한 로그 변환된 소지역 모델의 계층적 베이즈 추정
- 공공기관의 부채비율 결정요인
- 청탁금지법 시행이 경조비 지출에 미친 효과에 관한 실증분석
- 불균형 시계열 자료를 위한 분류 알고리즘 적용방안
- 시간 제약 제시 방식이 과제 수행에 미치는 영향
- 자동차 산업의 대·중소기업 간 임금격차 해소방안에 관한 연구
- 십분위분배율을 이용한 검벨분포의 적합도 검정
- 동서양 문화권에서 정서 자극의 각성 수준이 정서가 평가에 미치는 영향
- GOP모형을 이용한 섹터지수 포트폴리오의 성과분석
- 4대 공적연금 가입 여성의 연령별 출산율 자료구축
- QA 신경망 모델을 이용한 영미 시 감정 분류
- 경제분야 유튜브 인기 동영상의 대본과 댓글 연결망 비교 분석
- GARCH류 모형을 활용한 비트코인의 가격변화 특성에 관한 연구
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!