본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

웹 문서 내 출현 어휘의 범주 분류에 의한 검색 효율성 연구

이용수 0

영문명
Achieving Retrieval Effectiveness by Category Classification of Words Occurring in Web Documents
발행기관
한국자료분석학회
저자명
김윤식(Yun Sik Kim) 나동열(Dong-Yul Ra)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.7 No.5, 1893~1903쪽, 전체 11쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2005.10.30
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

기존 일반적 정보 검색은 검색키에 의한 문자열 비교 검색에 의한 유사도 측정 방법과 문서의 의미 범주별 분류에 의한 주제별 검색이 주를 이루었다. 이러한 검색 방법은 사용법이 간편하고 검색 속도가 빠르며 많은 정보가 검색되는 장점이 있으나 검색키의 중의성 문제, 쓰레기 문서의 대량 검출 등 많은 문제점이 발생한다. 본 연구에서는 검색키로 사용되는 어휘의 의미 분석을 이용하여 어휘가 출현하는 주제 분야별 가중치를 부여하여 검색 효율성 제고 방안을 제시하였다. 검색키와 일치하는 문서 내에 포함된 어휘들을 사전 정보를 이용하여 의미 분류 속성으로 문서의 주제별 범주를 판단하기 위해 단순 검색키의 의미 해석에 의한 키 확장, 출현 단어간 공기관계 등을 활용한다.

영문 초록

The conventional information retrieval methods are based upon either measuring similarity by string comparison of search keys or searching subject categories formed with classifying documents to subject categories. These retrieval methods have the advantage of being simple to use, fast in retrieval, and able to retrieve large amount of information. However, there arise problems such as ambiguity of search keys and retrieval of large number of garbage documents.This paper proposes a method of re-evaluating retrieval effectiveness by assigning weights to subject categories in which words occur by making use of semantic analysis of those words used for search keys. It is necessary to decide the subject category of documents by exploiting semantic class features of the words matching the search keys with the help of their lexical information in the dictionary. It is suggested to utilize co-occurring words and extend the key words by semantic interpretation of simple search keys.

목차

1. 서론
2. 검색어의 주제별 분류
3. 웹문서의 주제별 범주
4. 실험 및 분석
5. 결론
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김윤식(Yun Sik Kim),나동열(Dong-Yul Ra). (2005).웹 문서 내 출현 어휘의 범주 분류에 의한 검색 효율성 연구. Journal of The Korean Data Analysis Society (JKDAS), 7 (5), 1893-1903

MLA

김윤식(Yun Sik Kim),나동열(Dong-Yul Ra). "웹 문서 내 출현 어휘의 범주 분류에 의한 검색 효율성 연구." Journal of The Korean Data Analysis Society (JKDAS), 7.5(2005): 1893-1903

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제