본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

기계 학습을 이용한 한국어 문장 경계 인식

이용수 48

영문명
Korean Sentence Boundary Detection Using Machine Learning Technique
발행기관
청운대학교 방송예술연구소
저자명
임희석(Heui Seok Lim)
간행물 정보
『미디어와 공연예술 연구』제1권 제1호, 1~12쪽, 전체 12쪽
주제분류
사회과학 > 신문방송학
파일형태
PDF
발행일자
2006.04.30
4,240

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 논문은 기계 학습 기법 중에서 메모리 기반 학습을 사용하여 범용의 학습 가능한 한국어 문장 경계 인식기를 제안한다. 제안한 방법은 메모리 기반 학습 알고리즘 중 최근린 이웃(kNN) 알고리즘을 사용하였으며, 이웃들을 이용한 문장 경계 결정을 위한 스코어 값 계산을 위한 다양한 가중치 방법을 적용하여 이들을 비교 분석하였다. 문장 경계 구분을 위한 자질로는 특정 언어나 장르에 제한적이지 않고 범용으로 적용될 수 있는 자질만을 사용하였다. 성능 실험을 위하여 ETRI 코퍼스와 KAIST 코퍼스를 사용하였으며, 성능 척도로는 정확도와 재현율이 사용되었다. 실험 결과 제안한 방법은 적은 학습 코퍼스만으로도 98.82%의 문장 정확률과 99.09%의 문장 재현율을 보였다.

영문 초록

This paper proposes a Korean sentence boundary detection system which employs k-nearest neighbor algorithm. We proposed three scoring functions to classify sentence boundary and performed comparative analysis. We uses domain independent linguistic features in order to make a general and robust system. The proposed system was trained and evaluated on the two kinds of corpus; ETRI corpus and KAIST corpus. As experimental results, the proposed system shows about 98.82% precision and 99.09% recall rate even though it was trained on relatively small corpus.

목차

1. 서론
2. 관련 연구
3. 메모리 기반 학습을 이용한 문장 경계 인식
4. 실험 및 결과
5. 결론
[References]

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

임희석(Heui Seok Lim). (2006).기계 학습을 이용한 한국어 문장 경계 인식. 미디어와 공연예술 연구, 1 (1), 1-12

MLA

임희석(Heui Seok Lim). "기계 학습을 이용한 한국어 문장 경계 인식." 미디어와 공연예술 연구, 1.1(2006): 1-12

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제