본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

머신러닝 기반 지방대학 중도 탈락률 예측 모형 개발 및 빅데이터 분석을 통한 영향 요인 탐색: 2017-2023년 대학 정보공시자료를 활용하여

이용수 7

영문명
Development of a Machine Learning-Based Model for Predicting Dropout Rates in Regional Universities and Exploration of Influencing Factors through Big Data Analysis: Using University Information Disclosure Data from 2017 to 2023
발행기관
학습자중심교과교육학회
저자명
백은주(Eun-Ju Baek) 이승형(Seung-Hyung Lee)
간행물 정보
『학습자중심교과교육연구』제25권 1호, 231~256쪽, 전체 26쪽
주제분류
사회과학 > 교육학
파일형태
PDF
발행일자
2025.01.15
5,920

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

목적 본 연구는 지방대학의 중도 탈락 문제를 심층적으로 분석하고 중도 탈락률 예측 모형을 개발하여, 대학의 중도 탈락 방지를 위한 실질적 정책 방안을 제시하는 것을 목적으로 한다. 방법 이를 위해 2017년부터 2022년까지의 대학 정보공시 데이터를 활용하여 전국 140개 지방대학의 중도 탈락률 예측 모형을 개발하였다. 2023년을 예측 기준 연도로 설정하여 선형회귀분석, 의사결정나무, 랜덤포레스트, 서포트벡터머신, Gradient Boosting Machine 등 다양한 머신러닝 기법을 적용하였다. 본 연구에서 활용한 머신러닝 기법들은 데이터의 정규성 가정에 크게 의존하지 않는다는 장점이 있어, 일부 변수들의 정규성 가정 위배에도 불구하고 안정적인 예측이 가능하였다. 직전 1-2년의 중도 탈락률, 재학생 충원율, 신입생 충원율, 전임교원 확보율, 장학금 수혜율 등을 주요 변인으로 활용하였으며, 각 모형의 예측 성능은 평균절대오차(MAE), 평균제곱근오차(RMSE), 결정계수(R-squared) 등의 평가 지표를 통해 비교 검증하였다. 결과 서포트 벡터 머신(MAE 1.78)과 랜덤 포레스트(MAE 1.83) 모델이 가장 우수한 예측 성능을 보였다. 변수 중요도 분석을 통해 직전 1~2년의 중도 탈락률, 재학생 충원율, 장학금 수혜율 등이 중도 탈락률에 유의미한 영향을 미치는 것으로 확인되었다. 2024년 중도 탈락률 예측 결과, 국립대학은 3-5%, 사립대학은 5-12% 수준으로 나타났으며, 특히 일부 사립대학의 경우 10% 이상의 높은 중도 탈락률이 예측되어 시급한 대책 마련이 필요한 것으로 분석되었다. 결론 본 연구는 빅데이터와 머신러닝 기법을 활용하여 중도 탈락 문제에 접근했다는 점에서 방법론적 의의가 있으며, 정규성 가정에 구애받지 않는 분석 방법을 통해 신뢰성 있는 예측 결과를 도출하였다. 연구 결과를 바탕으로 국가 장학금 지원 확대, 대학 기본역량 진단 지표 개선, 교육 환경 개선을 위한 재정 투자 확대, 대학의 자율적 구조개혁 유도 등 구체적인 정책적 제언을 제시하였다.

영문 초록

Objectives This study aims to analyze the dropout problem in local universities in depth and develop a prediction model for dropout rates. Methods To this end, we developed a predictive model for the dropout rates of 140 regional universities nationwide, utilizing the university information disclosure data from 2017 to 2022. Setting 2023 as the base year for prediction, we applied various machine learning techniques such as linear regression analysis, decision trees, random forests, support vector machines, and gradient boosting machines. Key variables used in the model included the dropout rates from the previous 1-2 years, student enrollment rates, freshmen enrollment rates, full-time faculty ratios, and scholarship recipient rates. The predictive performance of each model was compared and validated using evaluation metrics such as mean absolute error (MAE), root mean square error (RMSE), and coefficient of determination (R-squared). Results The analysis results showed that random forest and gradient boosting machine models demonstrated the best predictive performance. Variable importance analysis confirmed that dropout rates from the previous 1-2 years, student enrollment rates, and scholarship rates had significant effects on dropout rates. Predictions for 2024 dropout rates were 3-5% for national universities and 5-12% for private universities. Conclusions This study has methodological significance in approaching the dropout problem using big data and machine learning techniques. Based on the research results, policy recommendations such as expanding financial support for students and strengthening academic adaptation programs were presented.

목차

Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법
Ⅳ. 분석 결과
Ⅴ. 결론 및 제언
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

백은주(Eun-Ju Baek),이승형(Seung-Hyung Lee). (2025).머신러닝 기반 지방대학 중도 탈락률 예측 모형 개발 및 빅데이터 분석을 통한 영향 요인 탐색: 2017-2023년 대학 정보공시자료를 활용하여. 학습자중심교과교육연구, 25 (1), 231-256

MLA

백은주(Eun-Ju Baek),이승형(Seung-Hyung Lee). "머신러닝 기반 지방대학 중도 탈락률 예측 모형 개발 및 빅데이터 분석을 통한 영향 요인 탐색: 2017-2023년 대학 정보공시자료를 활용하여." 학습자중심교과교육연구, 25.1(2025): 231-256

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제