학술논문
워드 임베딩 방법에 따른 가짜뉴스 판별 모델에 관한 연구
이용수 29
- 영문명
- A study on a fake news identification model based on word embedding method
- 발행기관
- 한국자료분석학회
- 저자명
- 이진혁(Jin-Hyeok Lee) 한상태(Sang-Tae Han)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.26 No.6, 1847~1853쪽, 전체 7쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2024.12.31
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
정보화 기술과 미디어화의 가속화 속에 가짜뉴스가 우리 사회의 심각한 문제로 대두되고 있다. 이러한 사회현상에 대응하여 뉴스가 가짜뉴스인지 아닌지를 판별할 수 있는 모델을 개발하여 가짜뉴스 노출에 취약한 현시점에서 사회적으로 유해한 영향을 줄이고 신뢰성 있는 정보 전달에 기여하고자 한다. 자연어를 처리하는 방법 중 단어 임베딩 방법을 기반으로 한 딥러닝 모델을 통해 가짜뉴스를 판별해 내고 그 모델의 성능을 높이고자 다양한 워드 임베딩 방법을 소개하고자 한다. 워드 임베딩 방법은 뉴스 텍스트 데이터에서 의미 있는 특징을 추출하고, 단어 간 의미적 유사성을 파악하는 방법인데, 이 방법을 활용하여 뉴스 기사의 실제 내용과 일치하지 않는 정보를 식별하여 가짜뉴스를 판별하고자 한다. 각 워드 임베딩 방법인 TF-IDF, Word2Vec, FastTextt의 임베딩 행렬을 생성하고, 가짜뉴스 판별 모델인 딥러닝 기반 LSTM 모델에 임베딩층의 가중치를 적용한 후, 모델의 정확도(accuracy)를 비교하여 더 우수한 워드 임베딩 방법을 제시하였다. 본 연구의 사례 분석을 통해 모델의 정확도를 비교한 결과 Word2Vec 방법이 TF-IDF와 FastText보다 더 우수한 결과를 얻었다.
영문 초록
Status of information technology and mediaization Fake news is emerging as a permanent problem in our society. By developing a model to detect fake news, we aim to deliver reliable information about the impact of the current coverage of fake news. Among natural language processing methods, we would like to introduce various embedding methods to share fake news and share the performance of the model through a deep learning model based on the word embedding method. The push embedding method is a method of extracting meaningful features from news text data and identifying meaning and consistency between words. This method is used to identify information that does not match the actual content of the news article and place importance on fake news. After generating the embedding matrix of each word embedding method, TF-IDF, Word2Vec, and FastTextt, and combining the embedding layer with the deep learning-based LSTM model, which is a model with fake news, the power (accuracy) of the model is compared to see which is superior. An embedding method was presented. Comparing the cooperation of the models across participants in this study, we show that the Word2Vec method outperforms TF-IDF and FastText.
목차
1. 서론
2. 자연어 처리 방법
3. 사례 분석
4. 결론 및 토의
References
해당간행물 수록 논문
- Leveraging distributed and parallel algorithm for normalized PCA in hyperspectral image analysis
- Spatial Neighborhood Order Determination for Gaussian Markov Random Fields
- Robust least squares support vector machine with the absolute error function
- Substitution of Recycled Aggregates and Social Acceptance: Public Perceptions and Willingness to Pay in Korea
- 함수열 회귀모형과 딥러닝 알고리즘을 이용한 노지채소의 수확량 예측
- 토픽 모델링을 이용한 열차 사고 관련 뉴스 동향 분석
- 조건부 Quatember 확률화응답모형에 의한 층화 및 층화이중 추정
- 자기상관이 존재하는 패널회귀모형에서 회귀계수의 추정에 관한 연구
- 한반도 집중호우 모의를 위한 심층 합성곱 생성적 적대 신경망의 강우 임계 설정에 관한 연구
- 통계적 회귀모형 및 머신러닝 모형들을 이용한 젖소의 우유 생산량 예측
- 워드 임베딩 방법에 따른 가짜뉴스 판별 모델에 관한 연구
- 수도권 가구의 주요 단기소득임산물 소비행태 추이 분석
- 기업의 지배구조와 기업가치에 대한 패널분석-농업협동조합
- 복지수혜 경험과 납세자의 세부담 인식 간의 관계
- 운전자본 보유수준이 기업 수익성과 가치에 미치는 차별적 영향: 제조업과 비제조업 비교
- 50인 미만 사업장에 대한 산업안전보건감독이 재해율에 미치는 영향: 대전·충남 지역 중심
- XAI를 활용한 국내 공모펀드 비용이 펀드성과에 미치는 영향 분석
- 거래량 충격이 기대수익률에 미치는 영향
- 국내 OTT 구독료 소득공제에 대한 경제적 파급효과
- 걷기 실천율 격차 변화와 박탈지수의 관련성: 일반화 가법 혼합 모형의 활용
- COVID-19와 주식시장의 행태에 관한 연구
- 다가구 주택의 범죄 예방을 위한 위험 요인 분석에 관한 연구
- 다문화청소년의 문화적응스트레스가 학교생활적응에 미치는 영향: 친구의지지와 자아존중감의 이중매개효과
- 한국 사이코패시 수준에 따른 핵심 특성 차이: 치료적 관점으로
- Journal of The Korean Data Analysis Society Vol.26 No.6 Contents
- Support Vector Machines with Reject Option for Unequal Costs and Imbalanced Datasets
- Exploring the Applicability of Digital Neuropsychological Assessments: A Comparative Study of CANTAB and CERAD-K in Elderly Koreans
- BERTopic 및 GCN 기반 키워드 분석을 통한 미디어 소비 패턴 연구
- Change Point Detection을 이용한 대한민국 기온 변화 분석
- 복합표본조사의 비율추정에 대한 자료 공표 기준
- 주식 포트폴리오 구성에 있어 차원축소 기법의 활용 가능성 분석
- 공변량 보정 베이지안 합동 모형을 활용한 지역별 우울증 유병률 추정
- 공공기관 사회공헌활동(CSR)의 결정요인: 기부금 지출을 중심으로
- 학업성취수준에 따른 학업성취도와 중도탈락 간의 차별적 관계
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!