본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

오분류 표본 탐지를 위한 강건한 SVM에 기반한 그래프 방법

이용수 12

영문명
A Simple Graphical Method for Detecting Consistently Misclassified Samples Using Robust SVM
발행기관
한국자료분석학회
저자명
권성훈(Shunghoon Kwon) 최호식(Hosik Choi)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.16 No.1, 125~133쪽, 전체 9쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2014.02.28
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

분류를 위한 분석방법으로 만들어진 스포터벡터기계학습(support vector machines; SVM)은 스포터벡터(support vector)라는 정보를 부수적으로 제공해 주는 장점을 가지고 있다. 스포터벡터들은 훈련집합의 부분집합으로 오분류되었거나 정분류되었다고 하더라도 분류의 정도가 떨어지는 자료를 나타내는데 이러한 스포터벡터들의 특징을 살펴보는 것은 실제 자료분석에서 중요한 의미를 가진다. 그러나 SVM의 분류규칙은 스포터벡터들이 분류규칙에 미치는 정도를 가중치로 하는 선형결합으로 표현되기 때문에 종종 이에 과도하게 의존하는 분류규칙을 만들어 낼 수 있다. 본 논문에서는 분류자료의 구성단계에서부터 자료내에 라벨링 오류를 가지고 있는 자료에 대한 이진분류문제에서 SVM보다 강건한 분류방법을 소개하고 이를 이용하여 잠재적으로 라벨링 오류를 가진 스포터벡터들을 보다 정확하게 탐지하기 위한 그래프 방법을 모색하고자 한다. 이를 위해 최근 제안된 강건한 SVM을 활용하여 분류정도의 추이를 그래프로 관찰하여 최종 판정하는 방법을 제안하고, 모의자료와 단백질 염기서열 자료를 활용하여 제안된 방법의 유용성을 실증하고자 한다. 제안된 방법은 기존의 종분류 체계와 잠재적으로 다소 상이할 수 있는 단백질 염기서열을 가지는 종들을 탐지함을 보여 주었다.

영문 초록

Support vector machines (SVM) has been established as a standard analyzing tool for classification. Additionally it can provide the information about support vectors. Support vectors are defined as a subset of training sample and those are misclassified samples or correctly classified samples with low degrees. Thus, it is important to investigate such support vectors in decision function. However, since the decision function of SVM is consisted of linear combination of support vectors, it often produces a decision rule with strongly dependent on such samples. In this paper, we consider the binary classification problem with labeling errors on output and introduce a robust SVM to deal with such noisy data. We propose a simple graphical method for detecting consistently misclassified samples using the robust SVM. Looking up a level set of decision boundaries including the traditional SVM, we can find mislabelled data easily. Furthermore we show good performance of the proposed graphical method through real example of protein classification in phylogeny. As results, we find some peculiar protein molecular sequences which are different to the previous phylogeny.

목차

1. 서론
2. 강건한 SVM
3. 제안된 오분류 표본 탐지 방법
4. 결론 및 토의
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

권성훈(Shunghoon Kwon),최호식(Hosik Choi). (2014).오분류 표본 탐지를 위한 강건한 SVM에 기반한 그래프 방법. Journal of The Korean Data Analysis Society (JKDAS), 16 (1), 125-133

MLA

권성훈(Shunghoon Kwon),최호식(Hosik Choi). "오분류 표본 탐지를 위한 강건한 SVM에 기반한 그래프 방법." Journal of The Korean Data Analysis Society (JKDAS), 16.1(2014): 125-133

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제