본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

In search of non-quantitative semiautomatic methods of collocations retrieval

이용수 14

영문명
In search of non-quantitative semiautomatic methods of collocations retrieval
발행기관
한국중동부유럽학회
저자명
Piotr Wierzchoń (피오트르 비에쉬호인)
간행물 정보
『동유럽발칸학』동유럽발칸학 제7권 제1호, 53~80쪽, 전체 28쪽
주제분류
사회과학 > 지역학
파일형태
PDF
발행일자
2005.06.20
6,160

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 논문은 번역에 있어서 어려움을 야기 시키는 collocation(복합 구문)의 반(半)자동적인 도출(導出) 방법에 대해 연구한 것이다. 폴란드어의 어형 변화와 biała niedziela, białej niedzieli, białe niedziele 같은 굴절형의 기본 동형(同形)형태 부재로 T-score, Gravity Counts, Dice, Mutual Information등의 음량(音量) 방법은 사전에서 표제어가 되는 낱말의 이형, 변화형을 하나로 묶기 위해 분류를 하는 형태소 분석기에 의존하게 되면서 이용 가치가 없어졌다. 현대 어휘의 분석에 있어서, 선 형태소 분석이 세부적이지 못하듯이 실제로도 이것은 큰 영향을 주지 않는다. 이와 같이 심한 어형 변화를 하는 언어에 있어서 연결 어휘의 자동적인 도출을 위해 주어진 어휘 결합의 빈도수를 조사하는 bigram과 같은 최적 음량 방법의 제안은 불가능한 것처럼 보일 수 있다. 이 제안은 주로 텍스트에 적용되는 기본 필터를 사용해서 분석할 수 있는 방법을 사용했으며, 문장에서 주로 어휘적인 가치가 있다. 이것은 두 개, 세 개, 네 개의 복합 구문이 tzw.와 같이 약자로 표시되고, 약자의 오른쪽은 마침표, 쉼표, 세미콜론에 의해 한정되는 방법에 대한 연구이다. 텍스트의 크기는 본 연구에서 중요하지 않다.

영문 초록

The article presents the semiautomatic method for excerption of collocations which cause most difficulties in translation practices. Due to the flectional features of the Polish language and the lack of homography of particular flection forms (biała niedziela, białej niedzieli, białe niedziele etc.), the quantitative methods such as T-score, Gravity Counts, Dice, Mutual Information etc. (cf. Daudaravičius, Marcinkevičiené 2004) lose their value since their use depends on the use of a competent morphological analyzer lemmatizing all flection forms to dictionary entry forms (lemmas). In the case of an analysis of contemporary vocabulary, noting phenomena of real life, such a morphological pre-analysis will be significantly slowed down. Thus, it seems impossible to propose an optimal quantitative method, e.g. bigram (i.e. in which an observation of frequency of given lexical connections is used; cf. Stubbs 2002, Yamamoto, Church 2001) for an automatic excerption of lexical connections in highly flectional languages. The proposition presented in this text has a mainly lexicographical value and involves the use of a simplified filter applied on a corpus. This is an observation of two-, three- and four-word collocations preceded by the abbreviation tzw. (so-called) and limited on the right side by a punctuation mark (e.g. full stop, comma, semicolon etc.). The size of the corpus does not matter in our research.

목차

국문 개요
Ⅰ. Introduction
Ⅱ. Research strategies
Ⅲ. Method
Ⅴ. Filters
Ⅵ. Concluding remarks
참고 문헌
Abstract

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

Piotr Wierzchoń,(피오트르 비에쉬호인). (2005).In search of non-quantitative semiautomatic methods of collocations retrieval. 동유럽발칸학, 7 (1), 53-80

MLA

Piotr Wierzchoń,(피오트르 비에쉬호인). "In search of non-quantitative semiautomatic methods of collocations retrieval." 동유럽발칸학, 7.1(2005): 53-80

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제