학술논문
치매 발병 여부 예측을 위한 통계적 모형 및 기계학습 기반 기법 적용에 관한 연구
이용수 330
- 영문명
- A Study on the Application and Comparison of Statistical Models and Machine Learning-based Techniques for Predicting the Onset of Dementia
- 발행기관
- 한국자료분석학회
- 저자명
- 정보미(Bomi Jeong) 김재훈(Jae Hoon Kim) 허태영(Tae-Young Heo)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.22 No.5, 1819~1834쪽, 전체 16쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2020.10.30
4,720원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구에서는 국민건강보험공단에서 제공하는 건강검진데이터를 활용하여 노인 당뇨병 환자들의 치매 발병 여부를 예측하고 가장 높은 예측 성능을 보이는 모형을 도출하고자 하였다. 연구 대상은 60세 이상 당뇨병 환자이며 성별, 연령, 4가지 대표적인 동반 질환(고혈압, 뇌졸중, 심장질환, 고지혈증) 발병 여부, 찰슨 동반 상병 지수, 당뇨병 약의 복용 여부를 설명변수로 사용하였으며 반응변수로 치매 발병 여부를 활용하였다. 본 연구를 위해 사용된 분석 모형으로는 생존분석에서 가장 보편적으로 사용되는 콕스 회귀모형과 기계학습 기반의 랜덤 생존 포레스트(random survival forest)와 딥서브(DeepSurv)를 적용하였다. 분석 데이터는 80%의 훈련 자료와 20%의 시험 자료로 구분하였으며 두 자료의 설명변수 및 반응변수의 차이는 존재하지 않음을 확인하였다. 하렐의 C지수를 통해 본 연구에서 적용한 콕스 회귀모형과 랜덤 생존 포레스트, 딥서브 모형 간 당뇨병 환자의 치매 발생 여부의 예측 성능을 비교하였으며 훈련 자료에서는 랜덤생존 포레스트, 시험 자료에서는 딥서브가 가장 높은 예측 성능을 보였다. 또한, 높은 위험도를 나타내는 변수를 추가하며 C지수의 증가 정도를 비교한 후 치매 발병 여부를 예측하기 위한 중요 요인을 도출하였다.
영문 초록
In this study, the health examination data provided by the National Health Insurance Service were used to predict the occurrence of dementia in elderly diabetics and to derive a model that showed the highest predictive performance. The explanation variables are gender, age, the incidence of four major companion diseases (hypertension, stroke, cardiovascular disease, hyperlipidemia) and Charlson Comorbidity Index and the response variable is dementia. The models used for this study were cox proportional hazard model that is the most commonly used linear models in survival analysis and Random Survival Forest and DeepSurv that are nonlinear models machine running techniques and deep running techniques. The analysis data were divided into 80% training data and 20% test data, and it was confirmed that there was no difference between the explanatory and response variables of the two data. Using Harrell s C index, the predicted performance of dementia in diabetics between Cox regression model, Random Survival Forest and DeepSurv model was compared. Among the 3 models, the Random Survival Forest showed the highest predicted performance, while the test data showed the highest predicted performance of the DeepSurv. In addition, an important factor was derived in predicting the incidence of dementia after comparing the increase in the C index by adding variables representing high risk.
목차
1. 서론
2. 연구대상 및 방법
3. 결과
4. 결론
Reference
해당간행물 수록 논문
- 2020년 국회의원 선거 기간의 유튜브 빅데이터 분석
- 범죄자 프로파일링을 위한 존속 살인 연구
- OECD 자료를 활용한 상속세가 민간투자와 경제성장률에 미치는 영향 분석
- 적응집락추출에 의한 보정추정에 대한 연구
- 치매 발병 여부 예측을 위한 통계적 모형 및 기계학습 기반 기법 적용에 관한 연구
- 간호대학생의 문화적 역량과 윤리적 민감성이 간호전문직관에 미치는 영향
- 동료 튜터링을 통한 사회정서역량 및 대학생 핵심역량 향상도 분석
- 소매업체의 옴니채널 서비스가 고객경험 및 고객충성도에 미치는 영향
- 주기도의 상관성을 이용한 시계열자료의 군집분석
- 머신러닝을 활용한 계절 시계열 예측
- 데이터마이닝과 통계적 기법에 의한 대학의 취업 및 진로 만족도에 대한 순차적 분석
- 코로나-19 상황에서의 심리적 수용과 의도적 반추의 매개효과
- 편마비 환자의 수면의 질, 사회적지지, 낙상효능감이 우울에 미치는 영향
- 우리나라 4대 도시의 인구이동과 수렴속도의 관계에 대한 실증분석
- 지지면과 욕창 단계에 따른 경계압력 차이
- LSTM 기반 모형의 주식시장 예측성 분석
- 아마추어 골퍼의 라이 변화가 샷에 미치는 영향
- 오픈 데이터와 격자 시스템을 이용한 세종시 실제 인구 추정
- 국내 이직 관련 질적 연구 및 빅데이터 연구에서 나타난 이직 선행요인에 대한 종합적 검증
- Forecasting Method for PM10 Concentrations in Seoul, with Adjustments for the Count Time Series Distribution and Excess Zeros
- 성격평가질문지 증보판 반응왜곡지표의 상대적 효율성 비교
- Piecewise Logistic Regression for Cluster Randomized Controlled Trial of Health System Interventions
- Demand Systems of Private Tutoring in South Korea
- 제주지역 정보화마을 자립 및 활성화 요인 분석
- 인라인 스케이트 클럽의 서비스스케이프가 서비스 만족과 재구매의도에 미치는 영향
- 버퍼거리에 따른 공간 랜덤포레스트를 이용한 월 평균기온 예측 성능 비교
- 중학교 국어교과서에 제시된 글의 장르 특성 비교 분석
- 코로나 19 전·후의 대학생 체육활동이 역량변화에 관한 연구
- 유럽 탄소배출권 시장과 에너지 시장 사이의 변동성전이
- 기업경기실사지수를 이용한 경기인식의 비대칭성 분석
- 사회적기업 직원들의 개인-조직 그리고 개인-직무 적합성 인식이 직무태도에 미치는 영향
- 상사의 비인격적 감독과 고객의 불량 행동이 카지노 종사원들의 감정노동을 매개로 직무소진에 미치는 영향
- 대학 인재상을 반영한 대학생 인성역량 평가지표 개발
- 자본 및 유동성 위험수준이 은행의 위험감수행위에 미치는 영향에 관한 연구
- SAMC 알고리즘을 이용한 미디어 패널 개인화 추천 알고리즘
- 가우시안 반응 모형을 활용한 정준대응분석 고찰
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!