본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

다단계 구단위화를 이용한 고속 한국어 의존구조 분석

이용수 2

영문명
High Speed Korean Dependency Analysis Using Cascaded Chunking
발행기관
한국시뮬레이션학회
저자명
오진영(Jin Young Oh) 차정원(Jeong Won Cha)
간행물 정보
『한국시뮬레이션학회 논문지』제19권 제1호, 103~111쪽, 전체 9쪽
주제분류
공학 > 기타공학
파일형태
PDF
발행일자
2010.03.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

한국어 처리에서 구문분석기에 대한 요구는 많은 반면 성능의 한계와 강건함의 부족으로 인해 채택되지 못하는 것이 현실이다. 본 연구는 구문분석을 레이블링 문제로 전환하여 성능, 속도, 강건함을 모두 실현한 시스템에 대해서 설명한다. 우리는 다단계 구 단위화(Cascaded Chunking)를 통해 한국어 구문분석을 시도한다. 각 단계에서는 어절별 품사 태그와 어절 구문표지를 자질로 사용하고 CRFs(Conditional Random Fields)를 이용하여 최적의 결과를 얻는다. 58,175문장 세종 구문 코퍼스로 10-fold Cross Validation(평균 10.97어절)으로 실험한 결과 평균 86.01%의 구문 정확도를 보였다. 이 결과는 기존에 제안되었던 구문분석기와 대등하거나 우수한 성능이며 기존 구문분석기가 처리하지 못하는 장문도 처리 가능하다.

영문 초록

Syntactic analysis is an important step in natural language processing. However, we cannot use the syntactic analyzer in Korean for low performance and without robustness. We propose new robust, high speed and high performance Korean syntactic analyzer using CRFs. We treat a parsing problem as a labeling problem. We use a cascaded chunking for Korean parsing. We label syntactic information to each Eojeol at each step using CRFs. CRFs use part-of-speech tag and Eojeol syntactic tag features. Our experimental results using 10-fold cross validation show significant improvement in the robustness, speed and performance of long Korea sentences.

목차

1. 서론
2. 관련연구
3. 제안 시스템
4. 실험 및 분석
5. 결론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

오진영(Jin Young Oh),차정원(Jeong Won Cha). (2010).다단계 구단위화를 이용한 고속 한국어 의존구조 분석. 한국시뮬레이션학회 논문지, 19 (1), 103-111

MLA

오진영(Jin Young Oh),차정원(Jeong Won Cha). "다단계 구단위화를 이용한 고속 한국어 의존구조 분석." 한국시뮬레이션학회 논문지, 19.1(2010): 103-111

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제