학술논문
기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항
이용수 45
- 영문명
- Considerations for Applying Korean Natural Language Processing Technology in Records Management
- 발행기관
- 한국기록관리학회
- 저자명
- 김학래
- 간행물 정보
- 『한국기록관리학회지』제22권 제4호, 129~149쪽, 전체 21쪽
- 주제분류
- 사회과학 > 사회과학일반
- 파일형태
- 발행일자
- 2022.11.30
무료
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.
영문 초록
Records have temporal characteristics, including the past and present; linguistic characteristics not limited to a specific language; and various types categorized in a complex way. Processing records such as text, video, and audio in the life cycle of records’ creation, preservation, and utilization entails exhaustive effort and cost. Primary natural language processing (NLP) technologies, such as machine translation, document summarization, named-entity recognition, and image recognition, can be widely applied to electronic records and analog digitization. In particular, Korean deep learning–based NLP technologies effectively recognize various record types and generate record management metadata. This paper provides an overview of Korean NLP technologies and discusses considerations for applying NLP technology in records management. The process of using NLP technologies, such as machine translation and optical character recognition for digital conversion of records, is introduced as an example implemented in the Python environment. In contrast, a plan to improve environmental factors and record digitization guidelines for applying NLP technology in the records management field is proposed for utilizing NLP technology.
목차
1. 서론
2. 자연어 처리 기술의 개요
3. 한국어 자연어 처리 기술의 활용
4. 기록관리를 위한 한국어 자연어 처리 기술의 고려사항
5. 결론
참고문헌
키워드
해당간행물 수록 논문
- 한국기록관리학회지 제22권 제4호 목차
- 공공기관 유튜브 동영상 아카이빙을 위한 메타데이터 핵심 요소 연구
- 기록 기술과 콘텐츠 서비스의 상호보완적 고도화 방안 연구
- 국내 기록보존 연구동향 분석
- 언어 네트워크 분석을 활용한 기록정보서비스 연구동향 분석
- 국가기록포털 검색서비스 품질 점검을 위한 평가셋 구축 및 현황 분석
- 신행정수도건설기록물 관리 사례 연구
- 근현대기록물의 보존 현황과 방안
- 구술 기록의 활용을 위한 패싯 기반 주제명표목 개발에 관한 연구
- 디지털화 기록 관리를 위한 메타데이터 요소(안) 설계
- 기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!