학술논문
텍스트 분할을 적용한 KoBART 기반의 실시간 장문 뉴스 요약 시스템 구현
이용수 16
- 영문명
- Implementation of KoBART-Based Real-Time Long-News Summarization System Using Text Segmentation
- 발행기관
- 한국산업기술융합학회(구. 산업기술교육훈련학회)
- 저자명
- 김명권(Myeong-Kwon Kim) 이상록(Sangrok Lee)
- 간행물 정보
- 『산업기술연구논문지』제29권 3호, 27~35쪽, 전체 9쪽
- 주제분류
- 공학 > 산업공학
- 파일형태
- 발행일자
- 2024.09.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 논문은 KoBART 모델을 기반으로 실시간 장문 뉴스 요약 시스템을 구현하였다. KoBART 모델은 토큰길이가 1024 이상의 뉴스에 대해 모델 특성상 요약이 불가하다. 이를 보완하기 위해 장문의 뉴스를 문단으로 분할하고, 분할된 문단을 요약한 후에 요약된 문장을 재요약하는 방식으로 구현하였다. 그리고, 공인된 AI 허브의 데이터셋으로 성능을 평가하여, 구현된 2단계 요약 방식의 타당성을 입증하였다. 하지만, AI 허브의 데이터셋에서 제공하는 뉴스의 토큰 길이가 대부분 1024 이하이므로, 허깅 페이스에서 제공하는 토큰 길이 1024 이상의 데이터셋을 적용하여 장문의 뉴스에 대한 요약 성능을 분석하였다. 토큰 길이가 1024 이상인 장문 뉴스를 512의 문단 크기로 분할하여 요약하면, 루지 스코어는 평균 33.99%이고, 요약 시 소요되는 실행시간은 0.8492초로 측정되었다. 따라서, 구현된 장문 뉴스 요약 시스템이 토큰 길이가 1024 이상의 장문 뉴스에서도 실시간 서비스가 가능함을 확인하였다.
영문 초록
In this study, a real-timelong-news summarization system is implemented based on the model. Owing to its characteristics, the KoBART model cannot summarize news with a token length of 1024 or more. Hence, we implemented a method of dividing long news into paragraphs, summarizing the divided paragraphs, and then resummarizing the summarized sentences. First, we evaluated the performance using an AI Hub dataset to validate the implemented two-stage summarization method. However, because the token length of most of the news provided in the AI Hub dataset is 1024 or less, we analyzed the performance for long news by applying the dataset provided by Hugging Face with a token length of 1024 or more. When summarizing long news with a token length of 1024 or more by dividing it into 512 paragraphs, the average Luge score is 33.99% and the runtime required for summarization is 0.8492 s. Therefore, we confirmed that the implemented long-news summarization system can provide real-time services, even for long news with a token length of 1024 or more.
목차
Ⅰ. 서 론
Ⅱ. 관련 연구
Ⅲ. 장문 뉴스 요약 시스템
Ⅳ. 시스템 성능 분석
Ⅴ. 결 론
ACKNOWLEDGEMENTS
References
키워드
해당간행물 수록 논문
- 산업기술연구논문지 제29권 3호 목차
- 조직 양면성과 직원몰입에 대한 창발적 리더십의 효과
- 페길화에 의한 재조합 산화환원 조절단백-1의 환원력 유지 최적화
- 보 단부에 철판을 매립한 PC 콘크리트 보의 실험연구
- 선삭 가공 공정에서 절삭력에 미치는 영향에 대한 실험계획법을 이용한 가공성 평가
- 조선용 B Gr. 강의 용접부 미세조직과 기계적 성질에 미치는 용접기법의 영향
- 열화율 기반 태양광 발전량 예측 머신러닝 모델 개발
- 병렬 운전을 통한 4kW급 인공위성용 아날로그 LLC 공진형 컨버터 개발
- 디지털 플랫폼 기반 패션기업의 성공 요인 연구 : B2C 공급망 전략 측면
- 계통연계형 PV(Photovoltaic) 설계 및 과도상태 특성 연구
- 딥러닝 기반의 주차 층수 탐지 애플리케이션의 개발
- 반도체 장비 교육을 위한 PLC기반 PID제어 가상 시스템 개발 및 구현에 관한 연구
- 자율주행 자동차의 주행을 위한 딥러닝 모델 연구
- 매립지 침출수 처리에서 질산화 공정 최적화 : pH 및 무기탄소원농도가 질소 제거에 미치는 영향
- M&A기업에서의 컬처덱을 통한 기업문화 정립에 관한 실행연구
- AWS DeepRacer를 활용한 강화학습 알고리즘의 성능 평가 및 실제 트랙 검증
- 자계 이방성 축 방향에 따른 안테나 공진 주파수 특성
- 텍스트 분할을 적용한 KoBART 기반의 실시간 장문 뉴스 요약 시스템 구현
- 다이나믹어포던스와 디지털파라메트릭 융합디자인 연구 - 공기 청정기 홀커버 디자인을 중심으로
- Estimating the Position of Logistics Management Robots Using a Modified Monte Carlo Algorithm
- 산업기술연구논문지 제29권 3호 목차
- Predicting Osteoporosis Prevalence Based on Ambient-Air Pollution Using Artificial Intelligence
- Integrating English Language Learning into Vocational Training at Korea Polytechnics
- Comparison of Changes in Obesity-Related Factors in C57BL/6N Mice Induced by High-Fat Diet or High-Fat Diet with Fructose Water
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!