본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

텍스트 마이닝 기반 비정형 데이터 분석 연구

이용수 510

영문명
A Study of Atypical Data Analysis Based on Text Mining - Focused on writing pattern analysis
발행기관
한국문화융합학회
저자명
강지훈(Kang Jihoon)
간행물 정보
『문화와융합』제42권 8호, 373~391쪽, 전체 19쪽
주제분류
복합학 > 학제간연구
파일형태
PDF
발행일자
2020.08.31
5,080

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

최근 4차 산업혁명으로 인해 ‘융합’에 대한 관심과 수요가 증가하는 추세이며 이와 관련하여 학문 분야에서는 학문 연구 방법으로 정보 기술을 활용하는 분야에 대한 연구가 활발하다. 특히 정보기술과 인문학이 결합된 이른바 ‘디지털 인문학’ 연구가 대표적인 사례이다. ‘디지털 인문학’은 정보기술의 활용을 인문학과 관련된 활동에만 제한하는 것이 아니며 다양한 분야에 정보기술이 적용될 수 있는 가능성에 대한 연구로 해석될 수 있다. 인문학 및 지역학 등을 위해 정보 기술을 활용하는 데 가장 필요한 자원 중 하나가 데이터이다. 최근에는 데이터를 수집 및 통합하고 데이터를 정량적으로 분석하여 도출된 정보를 학술 연구에 사용하는 이른바 데이터 분석 에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 이러한 데이터 분석 기술 중 텍스트 마이닝 기술을 사용하여 비정형 텍스트를 분석하고자 한다. 분석 대상으로 부산외국어대학교 지중해지역원에서 제작 중인 ‘지중해문명사전(가제)’에 텍스트 마이닝 기법을 적용하고 이를 통해 비정형 텍스트 데이터에서 의미 있는 정보를 찾고자 한다. 세부적으로 ‘지중해문명사전’의 표제어를 대상으로 글쓰기 패턴을 분석하여 해당 표제어의 내용이 ‘지중해문명사전’이 추구하는 목적에 부합하도록 작성되었는지 여부를 정량 분석을 통해 객관적으로 검증하고자 한다. 본 연구의 또 다른 목적은 인문학 등의 연구 분야에서 데이터 분석을 통한 결과물을 활용할 수 있는 방안을 제시하는 것이다. 본 연구에서의 구체적인 사례를 통해 인문 데이터 정량 분석을 수행하는 방법을 제시하고 다양한 연구 분야에 정보기술을 활용하는 방법을 제안하고자 한다.

영문 초록

As interest in the Fourth Industrial Revolution has recently increased, so have interest and demand for “convergence.” In this regard, studies on utilizing information technology as an academic research method are actively pursued; in particular, the study of the so-called “Digital Humanities,” which combine information technology with humanities, is a representative example. Digital Humanities are not construed to limit the use of information technology to this field and can be interpreted as a study on the possibility to apply information technology to various disciplines. One of the most necessary resources to utilize information technology in fields such as humanities and regional studies is data. In recent years, research has been actively conducted on the so-called data analysis, which collects and integrates necessary data and quantitatively analyzes them, using the derived information for academic research. This paper attempts to analyze atypical text using one of these data analysis techniques, namely text mining technology. As an object of analysis, text mining techniques are applied to the Mediterranean Civilization Dictionary, currently in progress at the Institute for Mediterranean Studies of Busan University of Foreign Studies, to extract meaningful information from atypical text data. Specifically, it intends to objectively verify whether the content of the headword meets the purpose of the Mediterranean Civilization Dictionary through quantitative analysis by examining its writing pattern. Another purpose of this study is to suggest a way to utilize the results through data analysis in research fields such as the humanities. Through specific examples, it presents a method for quantitative analysis of humanities data and proposes how information technology may be applied to various research fields.

목차

1. 서론
2. 데이터분석
3. 텍스트 마이닝 분석
4. 결론 및 향후연구

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

강지훈(Kang Jihoon). (2020).텍스트 마이닝 기반 비정형 데이터 분석 연구. 문화와융합, 42 (8), 373-391

MLA

강지훈(Kang Jihoon). "텍스트 마이닝 기반 비정형 데이터 분석 연구." 문화와융합, 42.8(2020): 373-391

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제