학술논문
웹 문서 내 출현 어휘의 범주 분류에 의한 검색 효율성 연구
이용수 0
- 영문명
- Achieving Retrieval Effectiveness by Category Classification of Words Occurring in Web Documents
- 발행기관
- 한국자료분석학회
- 저자명
- 김윤식(Yun Sik Kim) 나동열(Dong-Yul Ra)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.7 No.5, 1893~1903쪽, 전체 11쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2005.10.30
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
기존 일반적 정보 검색은 검색키에 의한 문자열 비교 검색에 의한 유사도 측정 방법과 문서의 의미 범주별 분류에 의한 주제별 검색이 주를 이루었다. 이러한 검색 방법은 사용법이 간편하고 검색 속도가 빠르며 많은 정보가 검색되는 장점이 있으나 검색키의 중의성 문제, 쓰레기 문서의 대량 검출 등 많은 문제점이 발생한다. 본 연구에서는 검색키로 사용되는 어휘의 의미 분석을 이용하여 어휘가 출현하는 주제 분야별 가중치를 부여하여 검색 효율성 제고 방안을 제시하였다. 검색키와 일치하는 문서 내에 포함된 어휘들을 사전 정보를 이용하여 의미 분류 속성으로 문서의 주제별 범주를 판단하기 위해 단순 검색키의 의미 해석에 의한 키 확장, 출현 단어간 공기관계 등을 활용한다.
영문 초록
The conventional information retrieval methods are based upon either measuring similarity by string comparison of search keys or searching subject categories formed with classifying documents to subject categories. These retrieval methods have the advantage of being simple to use, fast in retrieval, and able to retrieve large amount of information. However, there arise problems such as ambiguity of search keys and retrieval of large number of garbage documents.This paper proposes a method of re-evaluating retrieval effectiveness by assigning weights to subject categories in which words occur by making use of semantic analysis of those words used for search keys. It is necessary to decide the subject category of documents by exploiting semantic class features of the words matching the search keys with the help of their lexical information in the dictionary. It is suggested to utilize co-occurring words and extend the key words by semantic interpretation of simple search keys.
목차
1. 서론
2. 검색어의 주제별 분류
3. 웹문서의 주제별 범주
4. 실험 및 분석
5. 결론
참고문헌
키워드
해당간행물 수록 논문
- 프론티어 모델을 이용한 수익성분석
- 패밀리레스토랑 고객의 이용 특성에 관한 연구
- 수아세포종(Medulloblastoma) 마이크로어레이 데이터에 대한 치료 실패 표적 유전자와 관련된 연관성 규칙 탐사
- 통계적 기법을 활용한 균등화법에 의한 강의평가 개선 방안 연구
- A Numerical Comparison of Map Variability in SCA Using the Procrustes Analysis
- 웹 문서 내 출현 어휘의 범주 분류에 의한 검색 효율성 연구
- CRM 분석을 위한 고객세분화 및 수익성분석
- 인자분석자 혼합모형을 위한 Incremental EM 알고리즘
- 자동차보험 시장의 경쟁력 강화에 관한 연구
- 추출률 변동에 의한 CHAID 알고리즘의 탐색
- 동티모르의 2004 인구주택센서스
- Well-being시대의 남성정장 브랜드 선택과 고객가치에 대한 연구
- 평균이동절차와 결정적 어닐링 EM 알고리즘을이용한 자율적 칼라영상분할
- 전환비용이 유치원의 고객충성도에 미치는 영향
- 옵션내재변동성의 정보효과에 관한 실증연구
- 원격강의를 위한 Edutainment식 한자학습 시스템의 구현 및 평가
- 학원의 서비스품질이 관계품질과 관계유지의도에 미치는 영향
- On the assessment of validity and stability in cluster analysis
- 사상체질판별에 사용되는 문진표의 범주별 오류율 비교연구
- 지역문화축제인프라의 발전방향
- 아웃바운드 캠페인의 변경 희망률 추정을 위한 무응답 대체법 비교
- 용인지역 IT산업 육성 성공요인
- 평균반응과 분산반응을 고려하는 반응표면분석 사례연구
- 오분류율의 붓스트랩추정을 활용한 k-최근접이웃분류의 적용
- 용량-반응 곡선 분석을 위한 다단계 일반화 선형모형의 적용
- 국내 자본통제의 내생성에 관한 연구
- A Modified Graybill and Wang s Confidence Intervals
- Equilibrium Point Analysis of the Performance of IEEE 802.11 DCF under Poisson Packet Arrivals
- 디지털 유료 방송시스템 모델의 효율성 및 안전성 분석에 관한 연구
- 데이터마이닝을 이용한 한국 가구소득에 대한 통계 모형
- A Note on Bayesian Information Criterion in Model-Based Clustering
- On-Line LS-SVM Regression with Pruned Support Vectors - based on cross validatory choice of hyper-parameters
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!