학술논문
레이블 노이즈가 존재하는 자료의 판별분석 방법 비교연구
이용수 32
- 영문명
- A Comparative Study of Classification Methods Using Data with Label Noise
- 발행기관
- 한국자료분석학회
- 저자명
- 권소영(So Young Kwon) 김경희(Kyoung Hee Kim)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.20 No.6, 2853~2864쪽, 전체 12쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2018.12.31
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
판별분석(discriminant analysis)은 새로운 개체가 입력되었을 때, 그 개체가 어느 그룹에 속하는지 예측하는데 사용되는 분석방법이다. 판별분석에서는 레이블(label)을 통해 새로운 개체를 예측하기 때문에 판별분석에서 레이블은 중요하다. 레이블 노이즈(label noise)는 관측된 레이블에 오류가 포함된 것을 의미하며, 실데이터에 발생하기 쉽고 판별성능에 영향을 미칠 수 있는 중요한 요인이다. 이를 개선하기 위해 레이블 노이즈와 레이블 노이즈에 강건한 모형들이 연구되고 있지만, 레이블 노이즈가 존재할 때 판별성능에 영향을 줄 수 있는 요인을 고려하고 이 요인들이 판별성능에 미치는 영향을 비교한 연구는 찾기 힘들다. 따라서 이 논문에서는 분류문제에서 많이 사용되는 LDA, QDA, KNN, SVM 방법을 이용하여 레이블 노이즈가 판별성능에 미치는 영향을 알아보고자 한다. 특히 판별분석의 성능과 연관이 있을 것으로 예상되는 레이블 노이즈의 발생 비율, 발생형태, 데이터의 개수에 따른 판별성능을 모의실험을 통해 살펴보았다. 그 결과, 데이터의 형태와 분석기법에 따라 레이블 노이즈가 판별성능에 영향을 미치는 정도가 다름을 확인하였다.
영문 초록
Discriminant analysis predicts a class label of a new observation with an unknown label, using information from the existing labeled data. Hence, observed labels play a critical role in the analysis and we usually assume that these labels are correct. If the observed label contains an error, the data has label noise. Label noise can frequently occur in real data, which would affect classification performance. In order to resolve this, a comparative study was carried out using simulated data with label noise. In particular, we considered 4 different classification techniques such as LDA (linear discriminant analysis classifiers), QDA (quadratic discriminant analysis classifiers), KNN (k-nearest neighbour), and SVM (support vector machine). Then we evaluated each method via average accuracy using generated data from various scenarios. The effect of label noise was investigated through its occurrence rate and type (noise location). We confirmed that the label noise is a significant factor influencing the classification performance.
목차
1. 서론
2. 레이블 노이즈와 연관된 요인들
3. 모의실험
4. 결론 및 논의
References
키워드
해당간행물 수록 논문
- 교수의 리더십 유형이 대학생들의 전공만족과 학습몰입에 미치는 영향
- Nonprofit Accounting Information System and Charitable Donations: Evidence from Korea
- 기계학습을 이용한 복숭아 경락가격 및 거래량 예측모형 비교
- 구매자-공급자 간의 정보공유와 공급자에 대한 역량신뢰가 관계성과에 미치는 영향
- 영-과잉 회귀모형을 활용한 폭염자료분석
- 중년 및 고령운전자의 운전장면 개별요소에 대한 재인기억 차이
- 군집분석을 이용한 양파 감성사전 구축
- 조직몰입에 대한 사람중심 접근
- 연관성 규칙의 탐색을 위한 순수 대칭적 J 측도의 활용
- 층화 및 층화 이표본 조건부 무관질문모형
- 주택매매가격 영향요인의 비선형적 효과 분석
- An Empirical Study on Dimension Reduction
- The Effects of Emergent Leader on Team Cognitive Complexity and Team Performance
- 사회경제적 박탈이 우울에 미치는 영향에 관한 연구
- 구간형 데이터 검정법을 이용한 유전자 탐색에 관한 연구
- 회복마취간호사의 직무만족도 영향 요인
- 레이블 노이즈가 존재하는 자료의 판별분석 방법 비교연구
- 비인지적 요인이 취업에 미치는 영향
- 선거여론조사에서 투표율 반영을 통한 득표율 추정
- 다중 점진적 중도절단에서 지수분포의 적합도 검정
- 청소년의 스마트폰 사용시간 증가 예측요인
- 우리나라 기업의 해외진출 대상 국가에 관한 연구
- 연령과 성별에 따른 운영체제 업데이트 실시여부 실증분석
- 시장·기술지향성이 동남권 제조기업의 성과에 미치는 영향
- Bayesian Estimation of Three-parameter Bathtub Shaped Lifetime Distribution Based on Progressive Type-II Censoring with Binomial Removal
- 지역 축제의 경제성장 효과에 관한 실증분석
- Co-movements between VIX and Emerging CDSs: A Wavelet Coherence Analysis
- 중등학교 교장의 교사신뢰 형성을 위한 요구도 분석
- 음이항회귀모형을 이용한 꽃게 출하량에 관한 연구
- Stock Market Sentiment and Stock Returns
- 은행의 대출사업에 미치는 비이자부문 영업성과의 영향력
- Nonlinear Regression on Cold Tolerance Data for Brassica Napus
- 긍정사건이 직무열의에 미치는 영향에 대한 조절초점의 조절효과
- 한국자료분석학회지에 대한 토픽분석
- 영과잉 회귀모형을 이용한 광고노출분포 추정
- Estimation of p-values with Two Dimensional Null Distributions from Genomic Data Set
- 층화 혼합 승법 양적속성 확률화응답모형
- 최근 아시아 주식시장에서의 주식수익률 변동성의 비대칭적 반응
- 모멘텀과 투자자 지분율: 대만 주식시장
- 투자용 기술평가모형 개발사례 연구
- 건설기업의 경영효율성과 미청구공사의 가치관련성
- 다극화 지수와 지니 계수를 이용한 사교육비 양극화 추이 분석
참고문헌
관련논문
자연과학 > 통계학분야 NEW
- 행사성 사업의 효과 분석 방안
- Journal of The Korean Data Analysis Society (JKDAS) Vol.26 No.2 목차
- OTT 서비스 확산 이후 유료방송 VOD 이용의 결정 요인 분석
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!