학술논문
ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출방법
이용수 85
- 영문명
- Method of Extracting the Topic Sentence Considering Sentence Importance based on ELMo Embedding
- 발행기관
- 한국스마트미디어학회
- 저자명
- 김은희(Eun Hee Kim) 임명진(Myung Jin Lim) 신주현(Ju Hyun Shin)
- 간행물 정보
- 『스마트미디어저널』Vol10, No.1, 39~46쪽, 전체 8쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2021.03.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구는 뉴스 기사에서 기사문을 구성하는 문장별 중요도를 고려하여 요약문을 추출하는 방법에 관한 것으로 문장 중요도에 영향을 주는 특성으로 중심 문장(Topic Sentence)일 확률, 기사 제목 및 다른 문장과의 유사도, 문장 위치에 따른 가중치를 추출하여 문장 중요도를 계산하는 방법을 제안한다. 이때, 중심 문장(Topic Sentence)은 일반 문장과는 구별되는 특징을 가질 것이라는 가설을 세우고, 딥러닝 기반 분류 모델을 학습시켜 입력 문장에 대한 중심 문장 확률값을 구한다. 또한 사전학습된 ELMo 언어 모델을 활용하여 문맥 정보를 반영한 문장 벡터값을 기준으로 문장간 유사도를 계산하여 문장 특성으로 추출한다. LSTM 및 BERT 모델의 중심 문장 분류성능은 정확도 93%, 재현율 96.22%, 정밀도 89.5%로 높은 분석 결과가 나왔으며, 이렇게 추출된 문장 특성을 결합하여 문장별 중요도를 계산한 결과, 기존 TextRank 알고리즘과 비교하여 중심 문장 추출 성능이 10% 정도 개선된 것을 확인할 수 있었다.
영문 초록
This study is about a method of extracting a summary from a news article in consideration of the importance of each sentence constituting the article. We propose a method of calculating sentence importance by extracting the probabilities of topic sentence, similarity with article title and other sentences, and sentence position as characteristics that affect sentence importance. At this time, a hypothesis is established that the Topic Sentence will have a characteristic distinct from the general sentence, and a deep learning-based classification model is trained to obtain a topic sentence probability value for the input sentence. Also, using the pre-learned ELMo language model, the similarity between sentences is calculated based on the sentence vector value reflecting the context information and extracted as sentence characteristics. The topic sentence classification performance of the LSTM and BERT models was 93% accurate, 96.22% recall, and 89.5% precision, resulting in high analysis results. As a result of calculating the importance of each sentence by combining the extracted sentence characteristics, it was confirmed that the performance of extracting the topic sentence was improved by about 10% compared to the existing TextRank algorithm.
목차
Ⅰ. 서론
Ⅱ. 관련연구
Ⅲ. 딥러닝 기반 중심 문장 추출 방법
Ⅳ. 실험 및 결과
Ⅴ. 결론 및 제언
키워드
해당간행물 수록 논문
- Out-of-Vocabulary 단어에 강건한 병렬 Tri-LSTM 문장 임베딩을 이용한 감정분석
- 기계학습 분산 환경을 위한 부하 분산 기법
- 실시간 시선 추적기반 스마트 의료기기 고찰
- ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출방법
- 빅데이터 분석능력과 가치가 비즈니스 성과에 미치는 영향
- 광주광역시의 AI 특화분야를 위한 실용적인 접근 사례 제시
- IoT 헬스 데이터 공유를 위한 HFN 기반 권한 관리
- VGGNet을 활용한 석재분류 인공지능 알고리즘 구현
- 사회연결망분석을 활용한 웹 접근성 평가 지표 개발 방향 제안에 대한 연구
- 인공지능 기반 개인 맞춤형 의류 추천 서비스 개발
- 청각장애 운전자의 사용자경험에 기반한 자동차 내 청각정보 유형 분석
- Few-Shot Image Synthesis using Noise-Based Deep Conditional Generative Adversarial Nets
- 대용량 분산 Abyss 스토리지의 CDA (Connected Data Architecture) 기반 AI 서비스의 설계 및 활용
- Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 틱톡의 숏폼 콘텐츠 특성이 관광지 이미지 및 방문의도에 미치는 영향
공학 > 컴퓨터학분야 NEW
더보기최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!