본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측

이용수 21

영문명
Prediction of Netflix Content Viewing Time Using a Machine Learning Classification Model
발행기관
한국자료분석학회
저자명
고선제(SeonJe Ko) 김일주(Iljoo Kim)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.26 No.5, 1357~1373쪽, 전체 17쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2024.10.31
4,840

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

OTT(over-the-top) 시장은 COVID-19 이후 급속한 성장을 보이며 미디어 산업의 중심이 되고 있다. 이러한 환경에서 OTT 플랫폼의 경쟁력은 콘텐츠의 질과 양에 크게 좌우되고 있다. 이에 본 연구는 머신러닝 기법을 활용하여 대표적인 OTT 서비스 플랫폼인 Netflix에서 최근 공개한 콘텐츠별 시청 시간 데이터를 활용, 각 콘텐츠의 특성에 기반한 시청 시간 예측 모델을 개발함으로써 콘텐츠 제작 및 구매 결정에 도움을 줄 수 있는 지표를 제시하고자 한다. 본 연구는 IMDB, TMDB에서 수집한 콘텐츠의 특성 데이터를 예측 변수로 활용하였고, Netflix의 콘텐츠 시청 시간 예측을 학습하기 위해 Random Forest, Support Vector Machine(SVM), XGBoost 알고리즘을 적용한 분류 모델을 개발하였으며, Confusion Matrix와 ROC(receiver operating characteristic) Curve의 AUC(area under the ROC curve)를 사용하여 해당 모델의 성능을 평가하였다. 그 결과 세알고리즘 모두 시청 시간 예측에 있어 우수한 성능을 보였으며, 그 중 특히 XGBoost가 가장 뛰어난 성능을 보였다. 이러한 모델은 콘텐츠의 성공 또는 실패를 효과적으로 사전에 예측함으로써, OTT 플랫폼의 콘텐츠 관련 의사결정에 유용한 지표를 제공할 수 있을 것으로 기대된다.

영문 초록

The OTT (over-the-top) market has become the center of the media industry, showing rapid growth since COVID-19, and the competitiveness of an OTT platform largely depends on the quality and quantity of its contents. In this environment, this study aims to develop a model that can predict viewing time of each content based on its characteristics, utilizing machine learning techniques and the recent viewership data released by Netflix. This study used content characteristics data collected from IMDB and TMDB as predictor variables, and developed classification models applying Random Forest, Support Vector Machine (SVM), and XGBoost algorithms. The performance of each model was evaluated using Confusion Matrix and the AUC (area under the ROC curve) measure. As a result, all three algorithms showed good performance and XGBoost has demonstrated the best performance. The proposed model is expected to support OTT platforms to make a better decision on purchasing content licences or making original contents by effectively predicting the success or failure of the content in advance.

목차

1. 서론
2. 관련 연구
3. 모델링 및 실험 결과
4. 결론 및 향후 연구
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

고선제(SeonJe Ko),김일주(Iljoo Kim). (2024).머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측. Journal of The Korean Data Analysis Society (JKDAS), 26 (5), 1357-1373

MLA

고선제(SeonJe Ko),김일주(Iljoo Kim). "머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측." Journal of The Korean Data Analysis Society (JKDAS), 26.5(2024): 1357-1373

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제