학술논문
사용자 사전과 형태소 토큰을 사용한 트랜스포머 기반 형태소 분석기
이용수 27
- 영문명
- A Morpheme Analyzer based on Transformer using Morpheme Tokens and User Dictionary
- 발행기관
- 한국스마트미디어학회
- 저자명
- 김동현 김도국 김철희 신명선 서영덕
- 간행물 정보
- 『스마트미디어저널』Vol12, No.9, 19~27쪽, 전체 9쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2023.10.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
형태소는 한국어에서 의미를 가진 최소단위이기 때문에, 한국어 언어모델의 성능을 높이기 위해서는 정확한 형태소 분석기의 개발이 필요하다. 기존의 형태소 분석기는 대부분 어절 단위 토큰을 입력 값으로 학습하여 형태소 분석 결과를 제시한다. 하지만 한국어의 어절은 어근에 조사나 접사가 부착된 형태이기 때문에 어근이 같은 어절이어도 조사나 접사로 인해 의미가 달라지는 성향이 있다. 따라서 어절 단위 토큰을 사용하여 형태소를 학습하면 조사나 접사에 대한 오분류가 발생할 수 있다. 본 논문에서는 형태소 단위의 토큰을 사용하여 한국어 문장에 내재된 의미를 파악하고, Transformer를 사용한 시퀀스 생성 방식의 형태소 분석기를 제안한다. 또한, 미등록 단어 문제를 해결하기 위해 학습 말뭉치 데이터를 기반으로 사용자 사전을 구축하였다. 실험 과정에서 각 형태소 분석기가 출력한 형태소와 품사 태그를 함께 정답 데이터와 비교하여 성능을 측정하였으며, 실험 결과 본 논문에서 제시한 형태소 분석기가 기존 형태소 분석기에 비해 성능이 높음을 증명하였다.
영문 초록
Since morphemes are the smallest unit of meaning in Korean, it is necessary to develop an accurate morphemes analyzer to improve the performance of the Korean language model. However, most existing analyzers present morpheme analysis results by learning word unit tokens as input values. However, since Korean words are consist of postpositions and affixes that are attached to the root, even if they have the same root, the meaning tends to change due to the postpositions or affixes. Therefore, learning morphemes using word unit tokens can lead to misclassification of postposition or affixes. In this paper, we use morpheme-level tokens to grasp the inherent meaning in Korean sentences and propose a morpheme analyzer based on a sequence generation method using Transformer. In addition, a user dictionary is constructed based on corpus data to solve the out-of-vocabulary problem. During the experiment, the morpheme and morpheme tags printed by each morpheme analyzer were compared with the correct answer data, and the experiment proved that the morpheme analyzer presented in this paper performed better than the existing morpheme analyzer.
목차
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 사용자 사전과 형태소 토큰을 사용한 Transformer 기반 형태소 분석기
Ⅳ. 실험 및 평가
Ⅴ. 결론
REFERENCES
해당간행물 수록 논문
- Integration of Multi-scale CAM and Attention for Weakly Supervised Defects Localization on Surface Defective Apple
- 스마트미디어저널 Vol12, No.9 목차
- Corrigendum : 가치-태도-행동 모델을 적용한 호텔 AI 로봇서비스에 관한 연구
- YOLO 기반 실종자 수색 AI 응용 시스템 구현
- 웹툰 <화산귀환> 주인공 개성화 과정 연구
- 온·오프 강의에서 온라인 영어읽기 수업의 학습행태 사례 연구
- 3차원 공간 스캔을 위한 ToF-Stereo 융합 센서 시스템 설계
- Complexsystem 이론에 따른 지역문화 공연장 피난행태 개선에 관한 연구
- 손가락 움직임과 키 입력 데이터를 기반으로 한 MORPG 게임의 조작계 분석 방법론에 관한 연구
- 한국 차-연대기 문헌 DB 구축 및 웹서비스 구현
- 블록체인과 영지식 증명에 기반한 프라이버시 보호 기술 연구
- 익스플리싯 피드백 환경에서 추천 시스템을 위한 최신 지식증류기법들에 대한 성능 및 정확도 평가
- 음성 데이터의 내재된 감정인식을 위한 다중 감정 회귀 모델
- 최소비용 최대유량 알고리즘에 기반한 구급차의 환자이송 병원 배정 기법의 설계
- 개방형 정책 에이전트 기반 다자간 마이크로서비스 접근제어 정책
- 메타버스기반 체험학습 NFT보고서의 위치인식과 ID식별 설계
- Vision Transformer를 이용한 UAV 영상의 벼 도복 영역 진단
- 사용자 사전과 형태소 토큰을 사용한 트랜스포머 기반 형태소 분석기
- 화이트 박스 블록 암호에 대한 최신 암호분석 기술 동향 연구
- Corrigendum : 침투 공격 검출을 위한 비대칭 신호 스캐닝 기법
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 청소년들의 스마트폰 중독예방을 위한 이야기치료 집단상담 프로그램 개발
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 광역 대중교통 접근성 향상이 관광 및 지역경제 활성화에 미치는 효과 분석
공학 > 컴퓨터학분야 NEW
- 스마트미디어저널 Vol13, No.11 목차
- YOLO 모델별 독성 해양 생물 탐지 성능 비교 및 스마트 수산 기술 적용 가능성 탐색
- 무인자동 양식어류 급이공급 시스템 개발 및 검증
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!