본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

대화문 재구조화를 통한 한국어 대화문 요약

이용수 49

영문명
Summarization of Korean Dialogues through Dialogue Restructuring
발행기관
한국스마트미디어학회
저자명
김은희(Eun Hee Kim) 임명진(Myung Jin Lim) 신주현(Ju Hyun Shin)
간행물 정보
『스마트미디어저널』Vol12, No.11, 77~85쪽, 전체 9쪽
주제분류
공학 > 컴퓨터학
파일형태
PDF
발행일자
2023.12.31
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

COVID-19 이후 온라인을 통한 소통이 증가하여 다양한 플랫폼을 기반으로 소통을 위한 대화 텍스트 데이터가 대량으로 축적되고 있다. 텍스트 데이터로부터 유의미한 정보를 추출하기 위한 텍스트 요약에 대한 중요성이 더욱 증가함에 따라 딥러닝을 활용한 추상 요약 연구가 활발하게 이루어지고 있다. 그러나 대화 데이터는 뉴스 기사와 같은 정형화된 텍스트에 비해 누락 및 변형이 많아 대화 상황을 다양한 관점에서 고려해야 하는 특이성이 있다. 특히 어휘 생략과 동시에 내용과 관련 없는 표현 요소들이 대화의 내용을 요약하는 데 방해가 된다. 그러므로 본 연구에서는 한국어 대화 데이터의 특성을 고려하여 발화문을 재구조화하고 KoBART 기반의 사전학습된 텍스트 요약 모델을 파인 튜닝후, 요약문에서 중복 요소를 제거하는 정제 작업을 통해 대화 데이터 요약 성능을 향상시키고자 한다. 발화문을 재구조화하는 방법으로는 발화 순서에 따라 재구조화는 방법과 중심 발화자를 기준으로 재구조화하는 방법을 결합하였다. 대화문 재구조화 방법을 적용한 결과, Rouge-1 점수가 4 정도 향상되었다. 본 연구의 대화 특성을 고려한 재구조화 방법이 한국어 대화 요약 성능 향상에 유의미함을 입증하였다.

영문 초록

After COVID-19, communication through online platforms has increased, leading to an accumulation of massive amounts of conversational text data. With the growing importance of summarizing this text data to extract meaningful information, there has been active research on deep learning-based abstractive summarization. However, conversational data, compared to structured texts like news articles, often contains missing or transformed information, necessitating consideration from multiple perspectives due to its unique characteristics. In particular, vocabulary omissions and unrelated expressions in the conversation can hinder effective summarization. Therefore, in this study, we restructured by considering the characteristics of Korean conversational data, fine-tuning a pre-trained text summarization model based on KoBART, and improved conversation data summary perfomance through a refining operation to remove redundant elements from the summary. By restructuring the sentences based on the order of utterances and extracting a central speaker, we combined methods to restructure the conversation around them. As a result, there was about a 4 point improvement in the Rouge-1 score. This study has demonstrated the significance of our conversation restructuring approach, which considers the characteristics of dialogue, in enhancing Korean conversation summarization performance.

목차

Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 대화문 재구조화를 통한 한국어 대화문 요약
Ⅳ. 실험 및 결과
Ⅴ. 결론 및 제언
REFERENCES

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김은희(Eun Hee Kim),임명진(Myung Jin Lim),신주현(Ju Hyun Shin). (2023).대화문 재구조화를 통한 한국어 대화문 요약. 스마트미디어저널, 12 (11), 77-85

MLA

김은희(Eun Hee Kim),임명진(Myung Jin Lim),신주현(Ju Hyun Shin). "대화문 재구조화를 통한 한국어 대화문 요약." 스마트미디어저널, 12.11(2023): 77-85

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제