학술논문
텍스트 마이닝을 활용한 감정 비율 단어 그래프
이용수 63
- 영문명
- Sentiment ratio word graph using “local university” news articles and text mining
- 발행기관
- 한국자료분석학회
- 저자명
- 김장민(Jangmin Kim) 이연동(Yeondong Lee) 조영석(Youngseuk Cho)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.25 No.5, 1749~1757쪽, 전체 9쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2023.10.31
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
SNS, 논문, 설문조사 주관식 문항 답변과 같은 자연어로 이루어진 비정형 데이터는 텍스트 마이닝을 이용하여 분석 결과를 비교하거나 시각화하는 경우가 일반적이다. 년, 분기, 월, 요일과 같은 시간을 나타내는 임의의 구간을 설정하여 텍스트 데이터를 분석할 경우 전체 구간 중 어떤 구간에 데이터가 가장 많고 적은지, 전체 구간 중 구간별로 많이 사용된 감정 단어가 무엇인지, 특정 구간에 있는 텍스트 데이터가 상대적으로 얼마큼 많이 긍정보다 부정적으로 작성되었는지 판단해야 할 경우가 있다. 본 연구에서는 2019년부터 2022년까지 “지방대”와 관련된 뉴스 기사를 수집하기 위해 네이버에서 “지방대”라고 검색한 뒤 네이버 뉴스라고 표시된 기사만을 수집하여 위의 세 가지 정보를 한 번에 전달할 수 있는 감정 비율 단어 그래프를 제안한다. 감정 비율단어 그래프는 텍스트 데이터를 년, 분기, 월, 요일과 같은 시간을 나타내는 임의의 구간 기준으로 나눈 뒤 감성 사전에 있는 감정 점수를 텍스트 데이터에 부여하여 만들어진 그래프이다. 감정 비율 단어 그래프를 시각화할 때 파이계수도 같이 활용하여 단어를 표시한다면 특정 구간에서 감정 단어와 관련성이 가장 큰 단어가 무엇인지에 대한 정보를 추가로 전달할 수 있다.
영문 초록
Unstructured data consisting of natural language such as SNS, papers, and questionnaire subjective question answers are generally compared or visualized using text mining. When analyzing text data by setting a random interval representing a time such as year, quarter, month, and day, it may be necessary to determine which interval has the most data, which sentiment words are used a lot for each interval, and how much text data in a particular interval is written negatively than positive. As a way to solve this problem, this study proposes an sentiment ratio word graph that can deliver the above three information at once. An sentiment ratio word graph is a graph created by dividing text data by a random interval standard representing time such as year, quarter, month, and day of the week and then assigning the sentiment score in the sentiment dictionary to the text data. When visualizing an sentiment ratio word graph, if you also use the pie coefficient to display words, you can further convey information about which words are most relevant to the sentiment word in a particular interval.
목차
1. 서론
2. 데이터 설명 및 전처리
3. 감정 비율 단어 그래프 시각화
5. 결론
Reference
키워드
해당간행물 수록 논문
- Bottom-Up Projection of Regional Carbon Emissions from Passenger Road Vehicles Based on Discrete-Time Markov Chain
- 간호대학생 대상 시뮬레이션 실습교육의 효과에 대한 체계적 문헌고찰 및 메타분석
- 토픽모델링을 이용한 자율주행 연구 동향 분석
- 낙상 경험, 낙상 두려움, 낙상 두려움으로 인한 활동제약이 노쇠에 미치는 영향
- 전자의무기록 데이터와 머신러닝 기법을 활용한 중환자실 사망 예측모델 개발
- 임상간호사의 임종간호수행에 미치는 영향요인
- 아시아 국가들의 주관적 건강상태에 미치는 영향요인 분석
- COVID-19 발생 전후 ESG 투자성과가 유동성에 미치는 영향
- 경제정책 불확실성이 장단기 국채 수익률에 미치는 영향 분석
- 동형암호를 활용한 앙상블학습방법의 추론
- 토픽모델링과 시계열 분석을 활용한 국내외 독과점 산업 연구 동향 분석
- 금융 시계열 예측 신경망에서의 과적합 완화를 위한 임의 증강 기법
- 기계학습을 이용한 스마트 공장 자료의 불량 분류 모형 개발
- 112 신고 건수에 영향을 미치는 주요 변수 분석
- 토픽 모델을 활용한 지역 글로벌 컨퍼런스에 대한 참여자 만족도 분석
- 전통적 IPA와 Vavra의 수정된 IPA 비교분석을 통한 설악문화제 활성화 방안
- 범주 불균형 금융 문제의 해결을 위한 부스팅 학습
- 보험회사의 신종자본증권 발행과 기업가치 관련성
- 부산 경남지역의 지역내총생산 동조성에 관한 연구
- 기술적 비효율성의 오지정이 확률변경모형의 최대가능도 추정에 미치는 영향
- XAI SHAP 기반 토지 피복 구성에 따른 지표면 온도의 영향 분석
- 함수형 시계열 자료를 위한 추정 및 예측모형과 응용
- A Study about Inequality in the Scholarly Publishing of Korean Research Institutions using the Gini Coefficient
- 희박한 최소 절대 편차 지지벡터기계
- Vector Generalized Additive Models for Extreme Rainfall Data Analysis: A case study in South Korea
- 다문화 학령기 아동의 자아존중감 모형
- Journal of The Korean Data Analysis Society (JKDAS) Vol.25 No.5 목차
- 텍스트 마이닝을 활용한 감정 비율 단어 그래프
- 예상치 못한 외국인 순매도로 인한 비대칭적 변동성
참고문헌
관련논문
자연과학 > 통계학분야 BEST
더보기자연과학 > 통계학분야 NEW
- Journal of The Korean Data Analysis Society (JKDAS) Vol.27 No.1 Contents
- A Research on ESG Commitment, Governance, and Firm Value
- 영상 콘텐츠 추천시스템을 위한 AWSGLD 알고리즘
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
