학술논문
랜덤 포레스트 모델을 이용한 성인의 우울증 예측
이용수 70
- 영문명
- Predicting Depression om Adults using a Random Forest Model : Focusing on the 8th Korean National Health and Nutrition Examination Survey
- 발행기관
- 한국자료분석학회
- 저자명
- 김태훈(Taehun Kim) 김난이(Nani Kim) 송지연(Jiyeon Song) 정현진(Hyeonjin Jeong) 이은민(Eunmin Lee)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.25 No.4, 1449~1462쪽, 전체 14쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2023.08.31
4,480원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구는 기계학습 중 하나인 랜덤 포레스트 모델을 통해 성인의 우울을 예측하고자 시도되었다. 모델의 학습을 위한 연구 대상은 국민건강영양조사 8기(2019-2021) 자료 중 2주 이상의 우울감을 가진 대상자 1,086명, 가지고 있지 않은 대상자 8,826명으로 전체 9,896명으로 입력 변수는 20개였다. 본 연구의 모델 구축 및 평가를 위해 모든 코드는 Python 3.9.7로 작성되었으며, 통계 및 모델 구축을 위해 SciPy 1.614, ELI5, Scikit-learn 1.2.2, 패키지가 사용되었다. 분석은 학습에 사용될 원시 자료의 상관관계와 평균, 표준편차, 빈도, 비율, 그리고 모델의 예측에 영향을 주는 변수들의 값과 모델의 종합적 성능을 평가하였다. 연구결과 우울증 예측에 영향을 주는 요인들로 스트레스, 성별, 직업, 신체활동, 건강 상태가 확인되었으며, 가장 큰 영향을 주는 요인은스트레스(0.099±0.008; 0.081±0.008)였다. 모델의 전반적 성능(AUC)은 0.920(95% CI, 0.919–0.921)로 정확도는 0.921(95% CI, 0.920-0.922)로 나타났다. 구축된 모델은 우울증의 패턴을 찾아낼 수있었으며, 임상 현장에서 우울증 선별에 있어 신속하고 정확한 결정을 지원할 수 있을 것이다.
영문 초록
This study attempted to predict depression in adults using a random forest model, a type of machine learning. The research subjects for training the model were 1,086 subjects with depression for more than 2 weeks and 8,826 subjects without depression, totaling 9,896 subjects from the 8th Korea National Health and Nutrition Examination Survey (2019-2021), and 20 input variables. For model building and evaluation in this study, all code was written in Python 3.9.7, and packages SciPy 1.614, ELI5, and Scikit-learn 1.2.2 were used for statistics and model building. The analysis evaluated the correlations, means, standard deviations, frequencies, proportions, and values of the variables affecting the prediction of the model and the overall performance of the model. The results showed that stress, gender, occupation, physical activity, and health status were identified as factors affecting the prediction of depression, with stress being the most influential (0.099±0.008; 0.081±0.008). The overall performance (AUC) of the model was 0.920 (95% CI, 0.919-0.921) with an accuracy of 0.921 (95% CI, 0.920-0.922). The built model was able to detect patterns of depression and could support rapid and accurate decisions in screening for depression in clinical settings.
목차
1. 서론
2. 연구방법
3. 연구결과
4. 논의
References
해당간행물 수록 논문
- Journal of The Korean Data Analysis Society (JKDAS) Vol.25 No.4 목차
- 전남 지역 농기계 탑승자 인적피해 교통사고의 유형별 특성 및 저감 대책
- 디퍼러닝 연계 교양교육튜터링 효과성 분석
- K 대학교 핵심역량에 관한 종단 연구
- 간호사의 일-생활 균형이 직무열의 및 직무성과에 미치는 영향과 조직지원인식의 조절된 매개효과
- 간호대학생의 임상 실습 권리 인식 측정 도구 개발
- 랜덤 포레스트 모델을 이용한 성인의 우울증 예측
- 요양병원 간호사의 간호근무환경, 직무스트레스, 이직의도
- 기업가적 태도가 창업에 미치는 영향
- 고령층 소득의 비선형적 지속성 분석
- 은퇴자의 보유자산 조기 고갈위험과 적정 자산배분에 관한 연구
- LDA 모형의 모형평가 및 잠재집단 해석 방법론에 대한 고찰
- 모바일 데이터 요금제 가입 선택의 결정요인 분석
- 평균온도와 자살 사망률의 연관성
- 층화 조건부 이산양적 확률화응답모형
- Performance of Risk Parity Strategy in Developed Markets
- Gender Differences of Smoking Stigma on Gender and Smoking Self-identification in Korean Smokers
- CEO Pay-performance Sensitivities in the ESG Managed Firms
- Video Vision Transformer를 이용한 벼의 수확량 예측과 Self-attention 시각화
- 인구통계학적 지표를 활용한 지방의 소멸위험 예측모형 개발
- 심리학적 한국어 분석 프로그램을 사용한 언어분석 비교
- 코로나19 시대 간호대학생의 비대면 건강관리 봉사활동 효과
- 청년창업기업의 생존율 변화 분석
- 전력 수요 시계열 분석과 장기예측
- 기상 및 토양환경 정보를 이용한 노지 채소의 토양수분 변화 및 예측 모델 개발
- 주택연금 가입자의 노후 대책 충분성에 대한 연구
- 한국 금융시장의 군집행태의 특성과 상호작용에 관한 연구
- 상호출자제한기업집단 소속 여부와 분기 이익조정
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!