학술논문
머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측
이용수 28
- 영문명
- Prediction of Netflix Content Viewing Time Using a Machine Learning Classification Model
- 발행기관
- 한국자료분석학회
- 저자명
- 고선제(SeonJe Ko) 김일주(Iljoo Kim)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.26 No.5, 1357~1373쪽, 전체 17쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2024.10.31
4,840원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
OTT(over-the-top) 시장은 COVID-19 이후 급속한 성장을 보이며 미디어 산업의 중심이 되고 있다. 이러한 환경에서 OTT 플랫폼의 경쟁력은 콘텐츠의 질과 양에 크게 좌우되고 있다. 이에 본 연구는 머신러닝 기법을 활용하여 대표적인 OTT 서비스 플랫폼인 Netflix에서 최근 공개한 콘텐츠별 시청 시간 데이터를 활용, 각 콘텐츠의 특성에 기반한 시청 시간 예측 모델을 개발함으로써 콘텐츠 제작 및 구매 결정에 도움을 줄 수 있는 지표를 제시하고자 한다. 본 연구는 IMDB, TMDB에서 수집한 콘텐츠의 특성 데이터를 예측 변수로 활용하였고, Netflix의 콘텐츠 시청 시간 예측을 학습하기 위해 Random Forest, Support Vector Machine(SVM), XGBoost 알고리즘을 적용한 분류 모델을 개발하였으며, Confusion Matrix와 ROC(receiver operating characteristic) Curve의 AUC(area under the ROC curve)를 사용하여 해당 모델의 성능을 평가하였다. 그 결과 세알고리즘 모두 시청 시간 예측에 있어 우수한 성능을 보였으며, 그 중 특히 XGBoost가 가장 뛰어난 성능을 보였다. 이러한 모델은 콘텐츠의 성공 또는 실패를 효과적으로 사전에 예측함으로써, OTT 플랫폼의 콘텐츠 관련 의사결정에 유용한 지표를 제공할 수 있을 것으로 기대된다.
영문 초록
The OTT (over-the-top) market has become the center of the media industry, showing rapid growth since COVID-19, and the competitiveness of an OTT platform largely depends on the quality and quantity of its contents. In this environment, this study aims to develop a model that can predict viewing time of each content based on its characteristics, utilizing machine learning techniques and the recent viewership data released by Netflix. This study used content characteristics data collected from IMDB and TMDB as predictor variables, and developed classification models applying Random Forest, Support Vector Machine (SVM), and XGBoost algorithms. The performance of each model was evaluated using Confusion Matrix and the AUC (area under the ROC curve) measure. As a result, all three algorithms showed good performance and XGBoost has demonstrated the best performance. The proposed model is expected to support OTT platforms to make a better decision on purchasing content licences or making original contents by effectively predicting the success or failure of the content in advance.
목차
1. 서론
2. 관련 연구
3. 모델링 및 실험 결과
4. 결론 및 향후 연구
References
해당간행물 수록 논문
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.5 Contents
- Joint Modeling of Multi-Scale Stock Price using Hierarchical Hidden Markov Models
- 머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측
- 대학 재학생들의 중도탈락 패턴 분석 및 이탈 예측: H 대학교를 중심으로
- 자율주행 차량 사고 원인 분석을 통한 안전성 제고 방안
- 문자중계와 몬테카를로 시뮬레이션 기반 배구 경기 승패 예측에 관한 연구
- 히스토그램 자료를 위한 성긴 k-평균 군집분석에 관한 연구
- 학습기에 따른 부스팅 성능 비교
- 의사결정나무 분석에 대한 국내 연구 동향 탐색
- 주식시장 수익률과 개인 투자자의 매매 성향
- 동태적 관점에서 본 환경정책과 생산성의 관계: 제조업을 중심으로
- DEA와 SFA 모형을 이용한 한국 프로야구의 비용효율성 분석
- 빅데이터를 활용한 소셜미디어 기후변화 회의론 네트워크와 인플루언서 메시지 구조 분석: 사회연결망 분석과 의미연결망 분석의 적용
- 축제 방문 동기에 따른 축제방문객 시장세분화 연구: 설악문화제 중심으로
- 투자심리와 주식 유동성 간의 관계
- 시니어 창업의 내·외적 동기가 창업의지와 창업행동에 미치는 영향
- 온라인 수업을 경험한 간호대학생의 학습몰입과 문제해결능력이 학업성취도에 미치는 영향
- 신규간호사의 임상수행능력에 영향을 미치는 요인
- 국내 간호대학생의 임상수행능력 관련 변인에 대한 체계적 문헌고찰 및 메타분석
- 스크린 골프 이용자의 수준별 경기력 비교 분석 및 스코어 예측
- 자율주행 자동화 수준과 도로형태에 따른 이차과제 수행과 상황인식 차이
- 자원 희소성(resource scarcity)이 자기 효능감에 미치는 영향: 지각된 통제감의 매개효과
- 댓글분석을 활용한 사이코패스 인식: 웹크롤링과 LDA를 중심으로
- 법적 판단에서의 증거평가 차원: 다차원 척도법 및 펴기의 적용
- 대학생의 디지털 리터러시 변화에 대한 종단연구: 잠재성장모형을 적용하여
참고문헌
관련논문
자연과학 > 통계학분야 BEST
더보기자연과학 > 통계학분야 NEW
- Joint Modeling of Multi-Scale Stock Price using Hierarchical Hidden Markov Models
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.5 Contents
- 머신러닝 분류 모형을 이용한 Netflix 콘텐츠 시청 시간 예측
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!