본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

확률화응답기법을 고려한 배깅 트리 구축방법

이용수 1

영문명
Bagged Tree with Randomized Response Technique
발행기관
한국자료분석학회
저자명
김진석(Jinseog Kim)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.13 No.4, 1789~1798쪽, 전체 10쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2011.08.30
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

여러 경로로 수집되고 있는 자료에는 개인의 민감한 정보가 포함될 수 있으며, 이를 방지하기 위해 최근에는 랜덤화, 교환 등의 데이터마스킹 방법을 이용하여 개인정보를 은닉하여 공개하고 있다. 확률화응답기법(randomized response technique)은 개인의 민감한 정보를 노출시키지 않으면서 연구자가 필요로 하는 정보를 알아낼 수 있는 조사방법이다. 데이터마스킹 기법으로 은닉된 자료를 데이터마이닝방법으로 분석할 경우 예측력이 떨어지는 측면이 있다. 이를 보완하기 위하여 최근 은닉자료를 분석하기 위한 데이터마이닝 방법론, 즉 개인정보보호 데이터마이닝 기법에 대한 연구가 활발히 진행되고 있다. Du and Zhan(2003)는 RRT에 의하여 개인정보가 은닉된 자료로 부터 트리모형을 구축하는 방법을 제안하였지만 모든 입력변수들이 이진변수인 경우에 적용이 가능하다. 본 논문에서는 목표변수가 개인의 민감한 정보를 포함하는 경우의 분류모형의 구축방법에 대하여 연구한다. 특히 목표변수가 RRT에 의해 은닉될 경우 트리모형을 기반으로 하는 배깅 모형의 구축방법에 대하여 소개하고 모의실험을 통하여 제안된 방법이 기존의 배깅 방법에 비해 정확도가 향상됨을 보였다.

영문 초록

To protect personal information in micro data, the original data sets were often disguised using masking methods such as the random perturbation and swapping. However, applying classical data mining techniques to such a disguised data set may produce poor performance models in terms of prediction accuracy. Many authored have been developed the data mining methods for disguised data, which is called the privacy preserving data mining. In this paper, we focus the building decision tree algorithm when data is disguised by the randomized response technique by Du and Zhan. Since their algorithm can be only used binary inputs. In this paper we propose a bagging method based on decision trees when target variable in data set is disguised by RRT. Simple simulation results show that our algorithm is more accurate in terms of prediction error than a classical method.

목차

1. 서론
2. 확률화응답기법
3. 트리모형
4. RRT에 의해 입력변수가 은닉될 경우의 트리모형
5. RRT에 의해 목표변수가 은닉될 경우의 배깅 방법
6. 모의 실험
7. 결론
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김진석(Jinseog Kim). (2011).확률화응답기법을 고려한 배깅 트리 구축방법. Journal of The Korean Data Analysis Society (JKDAS), 13 (4), 1789-1798

MLA

김진석(Jinseog Kim). "확률화응답기법을 고려한 배깅 트리 구축방법." Journal of The Korean Data Analysis Society (JKDAS), 13.4(2011): 1789-1798

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제