본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출방법

이용수 85

영문명
Method of Extracting the Topic Sentence Considering Sentence Importance based on ELMo Embedding
발행기관
한국스마트미디어학회
저자명
김은희(Eun Hee Kim) 임명진(Myung Jin Lim) 신주현(Ju Hyun Shin)
간행물 정보
『스마트미디어저널』Vol10, No.1, 39~46쪽, 전체 8쪽
주제분류
공학 > 컴퓨터학
파일형태
PDF
발행일자
2021.03.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 연구는 뉴스 기사에서 기사문을 구성하는 문장별 중요도를 고려하여 요약문을 추출하는 방법에 관한 것으로 문장 중요도에 영향을 주는 특성으로 중심 문장(Topic Sentence)일 확률, 기사 제목 및 다른 문장과의 유사도, 문장 위치에 따른 가중치를 추출하여 문장 중요도를 계산하는 방법을 제안한다. 이때, 중심 문장(Topic Sentence)은 일반 문장과는 구별되는 특징을 가질 것이라는 가설을 세우고, 딥러닝 기반 분류 모델을 학습시켜 입력 문장에 대한 중심 문장 확률값을 구한다. 또한 사전학습된 ELMo 언어 모델을 활용하여 문맥 정보를 반영한 문장 벡터값을 기준으로 문장간 유사도를 계산하여 문장 특성으로 추출한다. LSTM 및 BERT 모델의 중심 문장 분류성능은 정확도 93%, 재현율 96.22%, 정밀도 89.5%로 높은 분석 결과가 나왔으며, 이렇게 추출된 문장 특성을 결합하여 문장별 중요도를 계산한 결과, 기존 TextRank 알고리즘과 비교하여 중심 문장 추출 성능이 10% 정도 개선된 것을 확인할 수 있었다.

영문 초록

This study is about a method of extracting a summary from a news article in consideration of the importance of each sentence constituting the article. We propose a method of calculating sentence importance by extracting the probabilities of topic sentence, similarity with article title and other sentences, and sentence position as characteristics that affect sentence importance. At this time, a hypothesis is established that the Topic Sentence will have a characteristic distinct from the general sentence, and a deep learning-based classification model is trained to obtain a topic sentence probability value for the input sentence. Also, using the pre-learned ELMo language model, the similarity between sentences is calculated based on the sentence vector value reflecting the context information and extracted as sentence characteristics. The topic sentence classification performance of the LSTM and BERT models was 93% accurate, 96.22% recall, and 89.5% precision, resulting in high analysis results. As a result of calculating the importance of each sentence by combining the extracted sentence characteristics, it was confirmed that the performance of extracting the topic sentence was improved by about 10% compared to the existing TextRank algorithm.

목차

Ⅰ. 서론
Ⅱ. 관련연구
Ⅲ. 딥러닝 기반 중심 문장 추출 방법
Ⅳ. 실험 및 결과
Ⅴ. 결론 및 제언

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김은희(Eun Hee Kim),임명진(Myung Jin Lim),신주현(Ju Hyun Shin). (2021).ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출방법. 스마트미디어저널, 10 (1), 39-46

MLA

김은희(Eun Hee Kim),임명진(Myung Jin Lim),신주현(Ju Hyun Shin). "ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출방법." 스마트미디어저널, 10.1(2021): 39-46

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제