학술논문
텍스트 마이닝을 활용한 개인정보유출 보고서의 군집 분석
이용수 95
- 영문명
- Cluster Analysis on Data Breach Reports via Text Mining
- 발행기관
- 한국자료분석학회
- 저자명
- 심현우(Hyunoo Shim)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.21 No.2, 877~887쪽, 전체 11쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2019.04.30
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
사이버 위험은 2000년 이후 폭발적으로 급증해 오고 있는 새로운 형태의 위험이다. 특히, 2010년대 들어 온라인 상거래가 증가하고 개인정보의 활용도와 수요가 증가하면서, 개인정보의 보호된 이용에 비례하여 불법적인 유출도 증가하고 있다. 이러한 개인정보유출 위험은 큰 경제적 손실을 야기하고 있는데, 일반적으로 새로운 위험이 등장하였을 때 위험으로 인한 손실을 이해하기 위해서 보험에서 가장 먼저 할 수 있는 일은 그 위험을 분류하는 것이다. 하지만, 개인정보유출 사건들을 어떤 유형들로 분류할 수 있는지에 대한 통계적인 분석은 현재까지 미비한 상황이다. 이 논문에서 우리는 개인정보유출 사례들의 보고서 문서들을 텍스트 마이닝으로 분석하였으며, 분석결과는 개인정보유출 문서에서 의료, 금융, 교육 관련 단어군들이 각각 밀접한 연관성을 가진 단어들로 묶여질 수 있는 대표군들인 것을 나타낸다. 유클리드 거리를 유사도 측도로 사용하여 K-평균 군집분석을 수행한 결과, 5개의 군집으로 분류하는 것이 가장 적절하며, 의료, 금융, 교육, 종이문서, 일반 군집으로 개인정보유출 사례 문서들을 분류할 수 있음을 보여준다.
영문 초록
Cyber risk is a new category of risk that has explosively emerged since 2000. Along with the increase of online commerce and the increase of utilization of and demand for private information in 2010s, unlawful breaches of private information are increasing in proportion to secured uses of private information. This data breach risk has caused large economic losses, and in general, the first task that insurance can act in understanding losses caused by a new type of risk is to classify it. There has existed, however, little statistical analysis concerning with the categories of data breach cases. In this paper, we analyzed the texts of data breach case reports via text mining, and the analysis result reveals that in data breach reports, the word groups with regard to medical, financial, and educational sectors are the representative ones that have high association within them. The K-means cluster analysis using the Euclidean distance as a similarity measure shows that 5 clusters are the most appropriate number of clusters and that the texts of data breach cases can be clustered into medical, financial, educational, paper-document, and general groups.
목차
1. 서론
2. 텍스트 마이닝 분석 방법
3. 자료
4. 단어 연관성 및 K-평균 군집 분석 결과
5. 결론
키워드
해당간행물 수록 논문
- 토픽모델링과 감성분석에 기반한 금통위 의사록 분석
- 거시건전성 규제가 은행의 대출공급에 미치는 영향
- 회계이익 구성요소의 상관관계가 회계이익 가치관련성에 미치는 영향
- 병원 내 이송요원의 개인보호구 착용 이행 영향요인
- 연관성 평가를 위한 조정된 순수 교차 엔트로피의 제안
- A Tale of Two Islands: Macroeconomic Impacts of Real Estate in Jeju and Okinawa
- 주변모형 및 주변모형의 모형검진을 이용한 한부모가족의 우울요인에 대한 분석
- 색상환 회상 과제의 반응 자료에 대한 혼합 모형 분석 절차의 이해
- 사회체육 참가자들의 심리적 욕구가 심리적 행복감에 미치는 영향
- 여대생의 산부인과 진료공포감, 사회규범에 따른 진료인식, 성지식이 산부인과 방문 의도에 미치는 영향
- 한·미 금리차가 환율에 미치는 영향분석
- 국제회계기준 도입 전후의 유형자산과 무형자산정보의 유용성
- 부산지역 노숙인과 비노숙인의 미충족 의료 경험에 대한 영향요인
- 핀테크 기업의 혁신성이 경험적 단서와 확장서비스 수용의도에 미치는 영향 : 광고 적합성의 조절효과를 중심으로
- 발생액의 질, 소유구조와 보유현금가치에 관한 연구
- 정보제약 하의 미니맥스 추정량 연구
- 텍스트 마이닝을 활용한 개인정보유출 보고서의 군집 분석
- 국내 육류 수요탄력성 추정에 관한 연구
- 경기변동 주기에서 설비투자 순환변동의 대내외적 요인 분석
- 공공하수처리시설 악취 개선에 대한 지불의사액 산정
- 부산방문 관광객의 경제적 파급효과 분석
- 한국의 소득계층별 소득과 소비의 관계 분석: 확산효과지수를 이용하여
- 한국 산업단지들의 경쟁력 우위 산업 분석에 관한 연구: 고용, 생산, 수출 데이터를 이용한 LQ 분석을 중심으로
- 중소기업 기술혁신지원사업이 고용에 미치는 효과 분석
- 에너지 전환의 경제적 영향 분석
- 고객과 이웃고객이 공통으로 평가한 응답이 예측오차에 미치는 영향
- 협업필터링 추천시스템에서 기초정보를 활용한 예측방법 조합에 관한 연구
- 농업인과 비농업인의 사고 경험률 및 건강관련 삶의 질 비교
- 소셜네트워크 자료를 위한 잠재적 위치군집 분석 개선 연구
- 종분류 그룹정보를 활용한 혈류감염 마이크로바이옴 자료의 분류방법
- Atypical Visual-Scan Paths of Emotion Recognition in Young Adults with Attention-deficit/hyperactivity Disorder Tendency
- Perception of Hospice Palliative Care and Self-acceptance among Nursing Students
- The Effects of Physical Postures on Emotion: Focusing on Inhibition of Body Postures
- The Post SEO Stock Under-Performance: Market Sentiment, Earnings Management, and Over-Investment
- Evolutionary Monte Carlo EM for Change Point Analysis
- 조건부 승법 무관양적속성 확률화응답모형
- Causal Linkage of Stock Market on Uncertainty Shock in Korea, the US, China and Japan
- 범위변동성을 이용한 저변동성 투자전략
- 생활체육 종목별 동호회 가입요인 분석
- 한국인의 주관적 건강상태와 우울이 건강관련 삶의 질에 미치는 매개효과: 제7기 2016년도 국민건강영양조사를 활용한 이차자료 분석
- 응급실 근무자의 성희롱 인식에 영향을 미치는 요인
- 주류 판매업자의 세제 인지도가 납세순응에 미치는 영향 : 조세정책 신뢰성의 매개효과를 중심으로
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
