학술논문
한글 문서의 통계적 특징
이용수 14
- 영문명
- Statistical Charateristics for Korean Texts
- 발행기관
- 호서대학교 중앙도서관
- 저자명
- 김수희
- 간행물 정보
- 『호서대학교 논문집』제3권, 173~184쪽, 전체 12쪽
- 주제분류
- 사회과학 > 무역학
- 파일형태
- 발행일자
- 1995.12.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
영문 초록
In this paper, the occurrence frequencies for three kinds of phonemes, syllables and words in ordinary Korean text are investigated from a corpus of over 800,000 words.
The six most frequent chosungs, jungsungs and jongsungs account for 70%, 80% and 90% of the corresponding phoneme occurrences, respectively. The number of syllables occurred in text is 1.705, which is about 15% of all possible syllables in mordem Korean. The 315 most frequent syllables account for 90% of all syllable occurrences. The 10 and 20 most frequent wods account for 4.4% and 6.6% of all word occurrences. While the average word length for distinct words is 3.88, the average length of word occurrences is 2.88.
목차
Abstract
1. 서론
2. 음소들(초성, 중성, 종성)의 출현 빈도
3. 음절의 빈도
4. 단어의 출현 빈도
5. 음소, 음절 그리고 단어의 Entropy
6. 결론
References
키워드
해당간행물 수록 논문
- Putative Secondary Structure of GroE mRNA
- English Text Compression in Parallel
- 저지방 육가공품 제조를 위한 전분 기조 지방 대체물의 특성 연구
- 음소 인식에 의한 한국어 연속 음성 특성에 관한 연구
- VITAL을 이용한 VHDL TTL 라이브러리 연구
- 8-배위 착물의 광화학적 특성 및 중합체에 관한 연구
- 칼슘 보충제의 종류가 흰쥐의 골격대사에 미치는 영향
- 광산란 방법에 의한 Sodium Dodecly Sulfate 미셀의 크기에 대한 연구
- 병렬 컴퓨터상에서 2차원상의 composite 분리 알고리즘
- 연두금파리(Lucilia illustris) 유충 혈림프의 용균효소(Lysozyme)
- Theoretical Analysis of Secondary Structure of Chloramphenicol Acetyltransferase mRNA
- 안티모니 112 핵의 빔쏘기 감마선 분광학
- 한글 문서의 통계적 특징
- Hangul Text Compression in parallel machine
- FANKS LEMMA FOR DIFFERENTIAL MAPS
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!