본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

유사 문장 말뭉치 분석을 통한 유사도 인식에 관한 연구

이용수 64

영문명
A Study on the Determination of Similarity through the Analysis of Similar Sentences Corpus
발행기관
어문연구학회
저자명
이숙의(Lee Suk-eui)
간행물 정보
『어문연구』語文硏究 第108輯, 63~89쪽, 전체 27쪽
주제분류
어문학 > 한국어와문학
파일형태
PDF
발행일자
2021.06.30
6,040

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본고에서는 유사 문장 말뭉치를 대상으로 자동시스템과 사람의 유사도 인식 결과를 대조·분석하였다. 자동시스템과 사람의 유사도 인식 불일치 결과를 주로 다뤘는데, 그 이유는 이러한 연구를 통해 컴퓨터와 인간이 문장을 이해 하는 방식이 서로 어떻게 다른가를 보기 위함이었다. 이러한 연구는 추후 구축될 유사 문장 말뭉치와 유사 문장 자동처리시스템 개발에 활용할 수 있다. 본 연구는 한국전자통신연구원의 유사 문장 학습 데이터 구축 결과를 활용하였고, 구축 과정에 적용한 유사도 판단을 위한 기준에 관한 검토를 진행하였다. 6개 구간의 점수대로 유사도 문장 쌍의 점수 값을 부여하였고, 3점 이상의 문장은 유사 문장에 해당된다. 주로 유사 문장의 경계에 놓인 문장 쌍들이 컴퓨터와 인간의 유사도 판단의 차이가 있는 지점임을 알 수 있었다. 자동시스템에서는 유사 문장으로 판단하지만 사람은 유사 문장이 아니라고 판단 한 예들을 중심으로 살펴 보았다. 이 결과를 통해 기초 작업에서 모호성이 짙었던 유사도 판단 기준을 구체화 하였으며, 이를 추후 연구에 반영하고자 한다.

영문 초록

This paper analyzed the corpus of similar sentences and compared the results of the computer system and manual work. In order to analyze how computers and humans understand the meaning of sentences differently, the results of inconsistency between humans and automatic systems for recognizing similarity were mainly analyzed. This paper utilized the results of constructing similar sentences learning data of the Electronics and Telecommunications Research Institute(ETRI). Here, the similarity criteria applied in the process of constructing language data for the ETRI project were reviewed. A similarity score was given by dividing into 6 sections, and sentences with a score of 3 or more are similar sentences. In Chapter 2, the definition of linguistic similar sentences was presented, and similar sentences types were classified. In addition, sentences surveyed in the actual corpus were also presented. Chapter 3 introduced the process of constructing a corpus of similar sentences. the results of corpus construction were used in this study. In Chapter 4, an example of inconsistency between the results of the automatic system and manual work was analyzed. In addition, I tried to reveal the difference between the automatic system that operates based on rules and the way humans understand sentences. It is hoped that the results of these studies will be utilized in the future development of the automatic processing system for similar sentences and the direction of corpus construction.

목차

1. 서론
2. 유사 문장의 유형
3. 연구 자료와 방법
4. 유사 문장 말뭉치 분석 결과
5. 결론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이숙의(Lee Suk-eui). (2021).유사 문장 말뭉치 분석을 통한 유사도 인식에 관한 연구. 어문연구, 108 (1), 63-89

MLA

이숙의(Lee Suk-eui). "유사 문장 말뭉치 분석을 통한 유사도 인식에 관한 연구." 어문연구, 108.1(2021): 63-89

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제