학술논문
기계 학습을 이용한 한국어 문장 경계 인식
이용수 48
- 영문명
- Korean Sentence Boundary Detection Using Machine Learning Technique
- 발행기관
- 청운대학교 방송예술연구소
- 저자명
- 임희석(Heui Seok Lim)
- 간행물 정보
- 『미디어와 공연예술 연구』제1권 제1호, 1~12쪽, 전체 12쪽
- 주제분류
- 사회과학 > 신문방송학
- 파일형태
- 발행일자
- 2006.04.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 논문은 기계 학습 기법 중에서 메모리 기반 학습을 사용하여 범용의 학습 가능한 한국어 문장 경계 인식기를 제안한다. 제안한 방법은 메모리 기반 학습 알고리즘 중 최근린 이웃(kNN) 알고리즘을 사용하였으며, 이웃들을 이용한 문장 경계 결정을 위한 스코어 값 계산을 위한 다양한 가중치 방법을 적용하여 이들을 비교 분석하였다. 문장 경계 구분을 위한 자질로는 특정 언어나 장르에 제한적이지 않고 범용으로 적용될 수 있는 자질만을 사용하였다. 성능 실험을 위하여 ETRI 코퍼스와 KAIST 코퍼스를 사용하였으며, 성능 척도로는 정확도와 재현율이 사용되었다. 실험 결과 제안한 방법은 적은 학습 코퍼스만으로도 98.82%의 문장 정확률과 99.09%의 문장 재현율을 보였다.
영문 초록
This paper proposes a Korean sentence boundary detection system which employs k-nearest neighbor algorithm. We proposed three scoring functions to classify sentence boundary and performed comparative analysis. We uses
domain independent linguistic features in order to make a general and robust system. The proposed system was trained and evaluated on the two kinds of corpus; ETRI corpus and KAIST corpus. As experimental results, the
proposed system shows about 98.82% precision and 99.09% recall rate even though it was trained on relatively small corpus.
목차
1. 서론
2. 관련 연구
3. 메모리 기반 학습을 이용한 문장 경계 인식
4. 실험 및 결과
5. 결론
[References]
해당간행물 수록 논문
참고문헌
관련논문
사회과학 > 신문방송학분야 BEST
더보기사회과학 > 신문방송학분야 NEW
- 능호관(凌壺觀) 이인상(李麟祥, 1710~1760) 전각(篆刻) 연구
- ‘손(手)’類 部首字 중심의 草書 字形 및 類似 字形에 관한 고찰
- 남북문화 동질성 회복 위한 북한 서예문화 현황 고찰 (2)
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!