본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

고전 번역 텍스트의 데이터 분석기술 적용과 한계

이용수 113

영문명
Application and Limit of Data Analysis Technology for Classical Translation Text - Focused on Analysis of Oral Records Using Okapi of Samguk Yusa
발행기관
한국문화융합학회
저자명
이정훈(Lee Jung Hoon)
간행물 정보
『문화와융합』제40권 6호, 155~184쪽, 전체 30쪽
주제분류
복합학 > 학제간연구
파일형태
PDF
발행일자
2018.10.30
6,400

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본고는 삼국유사 번역 텍스트를 데이터 분석 기술로 연구한 융복합 연구의 실례를 대상으로, 인문학적 관점에서 융복합 연구의 제반 문제를 논의한 것이다. 필자는 컴퓨터박사와 함께 6개월 동안 지속적인 세미나를 통해서 삼국유사 텍스트를 데이터 분석 기술로 어떻게 분석해야 하는지를 논의했다. 특히 세미나의 전 과정을 녹음하여서 구술녹취록을 작성하여 융복합 논의의 ‘과정’을 심도 있게 접근하기 위한 자료로 활용하였다. 이 과정을 통해서 최종적으로 오카피 단어가중치에 의한 매트릭스가 산출되었고, 이후 삼국유사 속에서 이러한 결과가 어떤 의미를 가지는지도 고찰하게 되었다. 그러나, 본고는 융복합 연구결과물을 위한 논의가 아니다. 오히려 융복합 연구의 진행과정을 통해서 이슈를 다섯 가지로 논의했다. 첫째는 학제 간의 개념소통이다. 삼국유사를 분석하기 위해 언급되는 화소, 구조, 작가의식 등의 단어는 이공계 연구자에게는 생소한 것이었다. 동일하게 매트릭스, TD, FD, Word2veo 등의 개념이 인문학자에게는 낯선 것이었다. 융복합 연구를 위해서는 이러한 개념소통이 먼저 이루어져야 한다. 둘째는 ‘자본’과 ‘노동력’의 문제다. 구글에서 진행했던 800만권의 도서관 DB구축 기획은 자본과 노동력이 뒷받침되어야만 가능하다. 빅데이터나 융복합의 기초는 방대한 DB에서부터 시작한다. 삼국유사의 결과물이 가능했던 것도 2013년에 산출된 박사논문이 있었기 때문에 가능한 것이었다. 아무런 데이터가 구축되지 않은 상태에서 생산력은 ‘자본력’에 의지하게 된다. 셋째, 전문가의 권위와 ‘일리’의 인문학이다. 공학기술은 독자적인 전문성으로 구성된다. 연구자의 특화된 기술을 이외의 사람들이 개입하거나 검증하기 어렵다. 공학기술은 ‘전문성’의 영역이기 때문에 그만큼 개별적으로 진행된다. 하지만 인문학의 ‘전문성’은 대중적 파급력을 지니며 공유된다. 이번 융복합 연구에서 요청된 ‘불용어’ 검증 요구는 이러한 ‘전문성’의 딜레마를 노출시켰다. 넷째, 투입된 노동과 효용성의 딜레마이다. 단어가중치의 성능을 높이기 위해서 가동되는 ‘불용어’ 구분은 노동의 투입량에 비해서 효율성이 낮다. 삼국유사와 같은 고전의 불용어를 정리하는데 드는 ‘시간’은 지난한 것이어서 실질적인 효용가치가 보장되지 않는 이상은 진행하기 어려운 성격이었다. 이것은 융복합 연구에서 성능을 향상시켜서 활용도가 곧 돈이 되는 것과는 다른 상황이다. 다섯째는 인문학적 분석방법론 개발과 해석의 역할이다. 알고리즘을 짜서 산출한 매트릭스는 그저 숫자일 뿐이다. 그것을 삼국유사 연구에 도움이 될 수 있도록 만들어주는 것은 결국은 ‘인문학적 안목’과 ‘분석방법론 개발’에 달려있다. 본고에서는 매트릭스를 3.4차례 수치화시켜서 ‘후백제 견훤’조의 분석을 시도하였다. 성공적인 융복합 연구를 위해서 기술만능주의(은탄환)나 편리함에 대한 ‘환상’을 버리고, ‘과정’으로서의 연구가 지속적으로 시도되어야 한다.

영문 초록

This paper discussed the various issues of convergence research from a humanistic perspective, with examples of convergence studies that studied the translation text of the Three Kingdoms through data analysis technology. In a six-month seminar, I discussed with my computer doctor how to analyze the text of the Three Kingdoms with data analysis techniques. In particular, the entire course of the seminar was recorded and oral recording was prepared to provide a detailed access to the ‘process’ of the combined discussion. The process finally resulted in a matrix based on the importance of the okapi words, and later we looked at the meaning of these results in the Three Kingdoms. However, this paper is not a discussion for convergence research. Rather, issues were discussed in five ways through the process of fusion research. The first is interdisciplinary communication. The words “storyline, structure, and author consciousness,” which are mentioned to analyze the history of the Three Kingdoms, were unfamiliar to researchers in the science and engineering community. Likewise, the concepts of matrix, TD, FD and Word2veo were unfamiliar to humanists. This concept communication must be made first in order to study convergence. The second problem is capital and labor. Google’s plan to build 8 million libraries is only possible if capital and labor are supported. The foundation of big data or convergence begins with a vast database. The results of the Three Kingdoms were also possible because of the doctoral dissertation produced in 2013. With no data built, productivity depends on ‘capital power’. Third, it is the authority of experts and the humanities of ‘Illy’. Engineering technology consists of its own expertise. It is difficult for anyone other than the researcher’s specialized skills to intervene or verify. Because engineering is an area of ‘speciality’, it is done individually. However, the “speciality” of humanities is shared with the public. The request for ‘stopword’ validation in the convergence study exposed this ‘specialty’ dilemma. Fourth, the dilemma of labor and utility put into place. The ‘non-use’ distinction that is used to improve the performance of words is less efficient than the input of labor. Time spent on organizing classical French words such as Samguk Yusa was outdated, so it was difficult to proceed unless practical utility was guaranteed. This is a situation where improved performance in a mixed-combination study is different from the one in which utilization becomes money. The fifth is the role of the development and interpretation of the humanities analysis methodology. The matrix, calculated from algorithms, is just a number. It is ultimately up to the ‘humanistic insight’ and ‘the development of analytical methodologies’ to make it useful for the research of the Three Kingdoms. This paper attempted to analyze the matrix by quantifying it 3.4 times. Research as a ‘process’ should be continuously attempted, abandoning the ‘conceptual’ of technical pragmatism or convenience for successful fusion research.

목차

1. 서론
2. 인문학적 성과를 컴퓨터 데이터 처리방식으로 어디까지 구현할 수 있는가
3. 구술채록본 분석을 통한 융복합연구의 기본 문제
4. ‘은탄환(silver bullet)’의 허상과 ‘과정’으로서 연구

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이정훈(Lee Jung Hoon). (2018).고전 번역 텍스트의 데이터 분석기술 적용과 한계. 문화와융합, 40 (4), 155-184

MLA

이정훈(Lee Jung Hoon). "고전 번역 텍스트의 데이터 분석기술 적용과 한계." 문화와융합, 40.4(2018): 155-184

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제