학술논문
텍스트 마이닝을 이용한 KBO 구단별 언론보도 행태 연구
이용수 255
- 영문명
- A Study on Press Reporting Trend by KBO Club using Text Mining: Focus on NC and Lotte in 2020 Season
- 발행기관
- 한국자료분석학회
- 저자명
- 이연동(Yeondong Lee) 조영석(Youngseuk Cho)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.24 No.1, 23~35쪽, 전체 13쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2022.02.28
4,360원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구의 목적은 우리나라 스포츠 언론이 KBO 참가 구단에 대해 어떻게 보도하고 있는지를 살펴보는 것에 있다. 이를 위해 텍스트 마이닝 기법을 활용하여 KBO 참가 구단 10개를 보도하는 기사를 비교 분석을 진행할 예정이었으나 보다 명확한 비교를 위해 10개 구단 중 구단 역사, 인기, 성적 등에서 가장 이질적이면서 대표적인 라이벌 관계인 ‘NC 다이노스’와 ‘롯데 자이언츠’를 다루는 언론 기사만을 분석하기로 하였다. 연구에 사용할 데이터는 네이버 스포츠에서 서비스한 기사만을 수집하였다. 이는 인터넷 언론의 특성상 같은 기사를 여러 언론사가 복제하는 이른바 ‘복제 기사’를 최대한 배제하기 위한 것이다. 또한 수집한 기사를 전처리(preprocessing)하여. KBO와 관련 없는 기사를 최대한 배제하였으며, 혹시나 있을 중복 기사 또한 제거하여 데이터에 기인하는 노이즈(noise)를 최대한 제거하였다. 수집한 데이터는 크게 3가지 방법으로 분석하였다. 첫번째 방법은 시기별 가사량 추이 추적이다. 기사량을 월별로 파악하여 특히 높은 시기의 기사를 워드 클라우드(word cloud)로 해당 기간의 주제를 확인 할 것이다. 두 번째 방법은 감성 분석(sentiment analysis)으로 월별 감정 추이(trend), 두 구단의 긍정, 부정기사 비율차이를 검정하였다. 세 번째 방법은 네트워크 분석(network analysis)으로 단어 동시 출현 빈도 분석(co-occurrence analysis), 연이은 단어 쌍 분석(n-gram analysis)을 실시하여 단어 간 관계를 분석하였다. 종합적으로 결론을 내리자면 ‘NC’의 언론보도 행태는 주로 ‘성적’에 맞추어져 있는 경향이 강했다. 월별, 일별 기사량이 가장 많은 시기가 ‘한국시리즈‘가 열린 11월에 집중되어 있었으며, 단어 간의 관계를 파악하는 ‘단어 동시 출현 빈도 분석(co-occurrence analysis)’과 ‘연이은 단어 쌍 분석(n-gram analysis)’에서 이런 경향이 매우 두드러졌다. ‘롯데’의 언론보도 행태는 ‘선수‘와 ‘타 구단‘의 비중이 높았다. 일별 기사량이 가장 많은 상위 3개 날짜 모두 선수, 타 구단과 관련 있었으며, 이는 ‘단어 동시 출현 빈도 분석(co-occurrence analysis)’ 이러한 경향이 강하게 드러났다.
영문 초록
The purpose of this study is to examine how Korean sports media are reporting KBO participating clubs. For the Study, we planned to conduct a comparative analysis of articles using text mining. ‘NC Dinos’ and ‘Lotte Giants’ were decided to analyze articles. Only articles provided by Naver Sports were collected for data to be used in the study. The collected data was analyzed in three main ways. The first way is to track the trend of article volume by period. Articles from a period when the monthly and daily article volume is particularly high will be checked by word cloud. The second way is sentiment analysis, examine including monthly sentiment trends and 2-sample test for equality of proportions in positive and negative. The third way is network analysis, and a total of three relational analyzes are performed: co-occurrence analysis, coefficient analysis, and n-gram analysis. In conclusion, the press reporting trend of ‘NC’ has a strong tendency to focus on ‘ranking’. The period with the highest amount of monthly and daily articles was concentrated in November, when ‘Korea Series’ was held. This trend was very prominent in ‘co-occurrence analysis’, ‘co-occurrence analysis’, ‘coefficient analysis’, and ‘n-gram analysis,’ which identifies the relationship between words. Press reporting trend of ‘Lotte’ had a high proportion of ‘players’ and ‘other clubs’. All of the top 3 dates with the highest daily article volume were related to players and other clubs, and this trend was stronger than ‘NC’ in ‘co-occurrence analysis’ and ‘co-occurrence analysis’.
목차
1. 서론
2. 데이터 설명
3. 데이터 전처리 및 조감(data preprocessing and bird s eye view)
4. 시기별 기사량(the number of articles by period)
5. 감성 분석(sentiment analysis)
6. 네트워크 분석(network analysis)
7. 결론
8. 제언
Reference
키워드
해당간행물 수록 논문
- 골프장 서비스 품질이 고객만족과 재이용의도 및 추천의도에 미치는 영향
- 행렬 프로파일을 이용한 금융 시계열 분석
- 네모틀 및 세리프 여부에 따른 한글 활자체의 가독성과 시감각 특성
- 이변량 토빗 모형을 이용한 직장 및 업무 만족도 분석
- Robust Interval Estimation Using Density Power Divergence
- 암환자를 돌보는 간호사의 도덕적 민감성과 도덕적 고뇌가 직무만족에 미치는 영향
- 변동성전이지수의 시간가변적 특성에 관한 연구
- 직관적 사고 경향에 따른 시간 할인 양상
- 의대생의 입학 동기 척도의 개발과 타당화
- 유럽지역의 소득불평등 결정요인분석
- 신규간호사의 직무스트레스와 이직의도 관계에서 회복탄력성의 매개효과
- 개인저축, 가구소득과 희망 자녀수
- Is the Activeness of ETFs Beneficial to Investors? Evidence from Korean Domestic Stock ETFs
- 은행의 생산성과 비용효율성에 미친 대출 구성의 단조·비단조적 영향력
- 피장타율과 수정된 이닝당출루허용률을 사용한 한국 프로야구 실점 설명
- 대학생의 스트레스 프로파일링 및 등록금 관련 변인의 관련성 검증
- 키워드 네트워크 분석을 통한 청소년 자해 연구 동향
- 텍스트 마이닝을 이용한 KBO 구단별 언론보도 행태 연구
- 중국관광객의 테마파크 체험경제요소, 기억, 플로우 및 체험만족 간의 영향관계 분석
- 원도심 상권 재생이 이용자 만족 및 재방문 의도에 미치는 영향에 관한 연구
- 기술분석보고서 발간이 주가 동조성에 미치는 영향에 대한 연구
- 생존자료에서 부분집단 분석 방법론의 비교
- 허들모형에서 과대산포의 효과에 관한 연구
- 부산 지역의 코로나 19 감염양상 이해를 위한 언론 텍스트 분석
- 신규공모 방식으로 민영화된 기업의 영업성과
- 마키아벨리즘 성향과 성차가 선의의 거짓말에 대한 암묵적 태도에 미치는 영향
- 결혼관과 자녀관을 통해 바라본 청년층의 현실 인식
- 계속적 과잉반응이 주식수익률에 미치는 영향
- 대학신입생의 중도탈락 예측 연구
- 빅데이터 분석을 활용한 해양쓰레기 유형 도출
- 현금 배당과 주가지수
- 직장 여성의 연령대별 주관적 행복감과 관련된 요인
- 야간위성 이미지를 이용한 격자 단위 인구 추정모형 개발
- 주택금융 및 보금자리론 실태조사 응답자들의 주택담보대출 만족 응답 일관성에 영향을 미치는 요인
- 경력몰입이 조직몰입에 미치는 영향
- Journal of The Korean Data Analysis Society Vol.24 No.1 목차
- 심리부검(psychological autopsy) 기반 알코올 사용장애 자살유형 분류
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!