학술논문
Fin-BERT 모델 기반 감성 점수 활용 주가 예측
이용수 0
- 영문명
- Stock Price Prediction utilizing Sentiment Scores Based on Fin-BERT Models
- 발행기관
- 한국자료분석학회
- 저자명
- 김영민(Young Min Kim) 강창완(Changwan Kang) 최용석(Yong-Seok Choi)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.27 No.1, 31~43쪽, 전체 13쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2025.02.28
4,360원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
경제 및 기술의 발전으로 인해 많은 사람이 주식에 대한 관심이 높아졌다. 이러한 관심을 발전된 머신러닝과 딥러닝 모형에 적용하여 많은 주가 예측 모델이 개발되었다. 최근의 연구는 주식에 대한 문자정보를 반영한 예측모형이 등장하였고 그 중 대부분의 연구는 뉴스 데이터를 이용하여 주가 예측 모델을 만들었다. 그러나 뉴스 데이터는 중립적인 경향이 너무 강해서 정확한 감성 분류가 어렵다고 판단되어 본 연구에서는 남녀노소 자유롭게 의견을 작성할 수 있는 커뮤니티 데이터인 네이버 종목토론실 데이터를 이용하여 주가 예측 모델을 만들고자 한다. 금융 도메인 데이터를 더 정확하게 감성 분류하기 위해 한국어 금융 데이터를 학습시킨 KR-FinBERT를 이용해서 감성 분류를 진행하였다. 주가는 최근 데이터에 영향을 가장 많이 받기 때문에 가중이동평균을 가중치로 이용하여 최종 감성 점수를 만들었다. 네이버 종목토론실 데이터로 만든 감성 점수가 주가 예측에 영향을 미치는지 확인하기 위해 Random Forest, XGBoost, LSTM 세 가지 분석 방법론을 이용하여 감성 점수가 있는 데이터로 만든 모델과 감성 점수가 없는 데이터로 만든 모델을 비교하였다. 모델 비교를 위해 사용된 평가 지표는 RMSE와 MAE가 사용되었다. 분석 결과 세 가지 분석 방법을 이용한 모델 비교에서 감성 점수가 있는 데이터의 평가 지표가 더 좋게 나와 감성 점수가 주가 예측에 영향을 미치는 것을 확인할 수 있었다
영문 초록
Economic and technological advancements have led to a growing interest in stocks for many people. Investors want to make profits, which has led to the creation of many stock price prediction models using machine learning and deep learning models. Most studies have used news data to create stock price prediction models, but news data tends to be too neutral to accurately classify sentiment. In this study, we aim to create a stock price prediction model using NAVER Stock Discussion Room data, a community data where people of all ages can freely write opinions. In order to more accurately classify sentiment in the financial domain, we used KR-FinBERT, which is trained on Korean financial data, to perform sentiment classification. Since stock prices are most affected by recent data, we used a weighted moving average as a weight to create the final sentiment score. To check whether the sentiment scores generated from the NAVER stock discussion board data have an impact on stock price prediction, we compared the models generated from the data with sentiment scores to the models generated from the data without sentiment scores using three different analysis methodologies. Random Forest, XGBoost, and LSTM. The evaluation metrics used to compare the models were RMSE and MAE. The results of the analysis showed that the evaluation metrics of the data with sentiment scores were better in the model comparison using the three analysis methods, confirming that sentiment scores have an impact on stock price prediction.
목차
1. 서론
2. 데이터 설명 및 Fin-BERT 모델
3. 예측 모델 설계
4. 결론
References
해당간행물 수록 논문
- Journal of The Korean Data Analysis Society (JKDAS) Vol.27 No.1 Contents
- A Research on ESG Commitment, Governance, and Firm Value
- 영상 콘텐츠 추천시스템을 위한 AWSGLD 알고리즘
- 영과잉 일반화 포아송 회귀모형에서 산포모수의 효과에 관한 연구
- 한국어 발화 텍스트 데이터 기반 성별 판별에 관한 사례연구
- 한국 성인 남녀의 하반신 체형 유형 비율의 시간에 따른 변화 연구
- 비모수 검정통계량을 이용한 회귀나무 분리기준 모의실험연구
- k-평균 군집화 알고리즘을 활용한 지역별 고향사랑기부제 특성 분석
- 50세 이상 한국 여성의 골다공증 영향 요인
- 보험회사의 고객만족과 고객민원의 상호작용 그리고 기업성과
- 만성질환 여부에 따른 운동이 심뇌혈관 진단에 미치는 영향
- Z세대 간호대학생의 미디어리터러시, 자기주장 행동, 수평적 개인주의 성향이 대학생활적응에 미치는 영향
- Fin-BERT 모델 기반 감성 점수 활용 주가 예측
- 정준 상관 분석을 이용한 침수 취약성 지수 개발 및 활용
- 워드 임베딩이 내재된 신경망 토픽모형을 이용한 텍스트 분석
- 토픽 출현 지도 기법을 활용한 출원 특허 기반 이머징 기술 분석
- 회전성을 갖는 반응표면 실험계획의 기울기회전성에 관한 고찰
- 간호대학생의 e-헬스 리터러시(인터넷 건강정보이해능력)가 정신건강증진행위에 미치는 영향
- 한국의 시도별 세대 간 소득이동성: 국민건강보험빅데이터를 이용한 분석
- 간호사의 코로나19 위험인식과 건강지각이 건강증진행위에 미치는 영향
- 상사 공정성과 경력개발지원 인식이 구성원의지식공유 및 지식은폐에 미치는 영향
- 인지 욕구, 지적겸손과 정서적 웰빙 간의 관계: 연령의 조절된 매개효과 검증
- 이성관계 불만족이 데이트폭력 가해행동에 미치는 영향의 성별 비교: 애착의 조절효과
- 드라마 색상에 대한 선호도 분석: <종이의 집> 원작과 리메이크작에 대한 파일럿 연구
- 전반적 자폐 표현형과 우울의 관계: 사회불안의 매개효과
- SFDA모형에 기초한 메타환경원단위효율 측정과 환경규제, 에너지전환, GDP의 관계
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
