본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

텍스트 마이닝을 이용한 KBO 구단별 언론보도 행태 연구

이용수 255

영문명
A Study on Press Reporting Trend by KBO Club using Text Mining: Focus on NC and Lotte in 2020 Season
발행기관
한국자료분석학회
저자명
이연동(Yeondong Lee) 조영석(Youngseuk Cho)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.24 No.1, 23~35쪽, 전체 13쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2022.02.28
4,360

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 연구의 목적은 우리나라 스포츠 언론이 KBO 참가 구단에 대해 어떻게 보도하고 있는지를 살펴보는 것에 있다. 이를 위해 텍스트 마이닝 기법을 활용하여 KBO 참가 구단 10개를 보도하는 기사를 비교 분석을 진행할 예정이었으나 보다 명확한 비교를 위해 10개 구단 중 구단 역사, 인기, 성적 등에서 가장 이질적이면서 대표적인 라이벌 관계인 ‘NC 다이노스’와 ‘롯데 자이언츠’를 다루는 언론 기사만을 분석하기로 하였다. 연구에 사용할 데이터는 네이버 스포츠에서 서비스한 기사만을 수집하였다. 이는 인터넷 언론의 특성상 같은 기사를 여러 언론사가 복제하는 이른바 ‘복제 기사’를 최대한 배제하기 위한 것이다. 또한 수집한 기사를 전처리(preprocessing)하여. KBO와 관련 없는 기사를 최대한 배제하였으며, 혹시나 있을 중복 기사 또한 제거하여 데이터에 기인하는 노이즈(noise)를 최대한 제거하였다. 수집한 데이터는 크게 3가지 방법으로 분석하였다. 첫번째 방법은 시기별 가사량 추이 추적이다. 기사량을 월별로 파악하여 특히 높은 시기의 기사를 워드 클라우드(word cloud)로 해당 기간의 주제를 확인 할 것이다. 두 번째 방법은 감성 분석(sentiment analysis)으로 월별 감정 추이(trend), 두 구단의 긍정, 부정기사 비율차이를 검정하였다. 세 번째 방법은 네트워크 분석(network analysis)으로 단어 동시 출현 빈도 분석(co-occurrence analysis), 연이은 단어 쌍 분석(n-gram analysis)을 실시하여 단어 간 관계를 분석하였다. 종합적으로 결론을 내리자면 ‘NC’의 언론보도 행태는 주로 ‘성적’에 맞추어져 있는 경향이 강했다. 월별, 일별 기사량이 가장 많은 시기가 ‘한국시리즈‘가 열린 11월에 집중되어 있었으며, 단어 간의 관계를 파악하는 ‘단어 동시 출현 빈도 분석(co-occurrence analysis)’과 ‘연이은 단어 쌍 분석(n-gram analysis)’에서 이런 경향이 매우 두드러졌다. ‘롯데’의 언론보도 행태는 ‘선수‘와 ‘타 구단‘의 비중이 높았다. 일별 기사량이 가장 많은 상위 3개 날짜 모두 선수, 타 구단과 관련 있었으며, 이는 ‘단어 동시 출현 빈도 분석(co-occurrence analysis)’ 이러한 경향이 강하게 드러났다.

영문 초록

The purpose of this study is to examine how Korean sports media are reporting KBO participating clubs. For the Study, we planned to conduct a comparative analysis of articles using text mining. ‘NC Dinos’ and ‘Lotte Giants’ were decided to analyze articles. Only articles provided by Naver Sports were collected for data to be used in the study. The collected data was analyzed in three main ways. The first way is to track the trend of article volume by period. Articles from a period when the monthly and daily article volume is particularly high will be checked by word cloud. The second way is sentiment analysis, examine including monthly sentiment trends and 2-sample test for equality of proportions in positive and negative. The third way is network analysis, and a total of three relational analyzes are performed: co-occurrence analysis, coefficient analysis, and n-gram analysis. In conclusion, the press reporting trend of ‘NC’ has a strong tendency to focus on ‘ranking’. The period with the highest amount of monthly and daily articles was concentrated in November, when ‘Korea Series’ was held. This trend was very prominent in ‘co-occurrence analysis’, ‘co-occurrence analysis’, ‘coefficient analysis’, and ‘n-gram analysis,’ which identifies the relationship between words. Press reporting trend of ‘Lotte’ had a high proportion of ‘players’ and ‘other clubs’. All of the top 3 dates with the highest daily article volume were related to players and other clubs, and this trend was stronger than ‘NC’ in ‘co-occurrence analysis’ and ‘co-occurrence analysis’.

목차

1. 서론
2. 데이터 설명
3. 데이터 전처리 및 조감(data preprocessing and bird s eye view)
4. 시기별 기사량(the number of articles by period)
5. 감성 분석(sentiment analysis)
6. 네트워크 분석(network analysis)
7. 결론
8. 제언
Reference

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이연동(Yeondong Lee),조영석(Youngseuk Cho). (2022).텍스트 마이닝을 이용한 KBO 구단별 언론보도 행태 연구. Journal of The Korean Data Analysis Society (JKDAS), 24 (1), 23-35

MLA

이연동(Yeondong Lee),조영석(Youngseuk Cho). "텍스트 마이닝을 이용한 KBO 구단별 언론보도 행태 연구." Journal of The Korean Data Analysis Society (JKDAS), 24.1(2022): 23-35

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제