학술논문
한국어 생의학 개체명 인식 성능 비교와 오류 분석
이용수 48
- 영문명
- Performance Comparison and Error Analysis of Korean Bio-medical Named Entity Recognition
- 발행기관
- 한국전자통신학회
- 저자명
- 이재홍(Jae-Hong Lee)
- 간행물 정보
- 『한국전자통신학회 논문지』제19권 제4호, 701~708쪽, 전체 8쪽
- 주제분류
- 공학 > 전자/정보통신공학
- 파일형태
- 발행일자
- 2024.08.31
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
딥러닝 분야에서 트랜스포머 아키텍쳐의 출현은 자연어 처리 연구가 획기적인 발전을 가져왔다. 개체명 인식은 자연어 처리의 한 분야로 정보 검색과 같은 태스크에 중요한 연구 분야이다. 생의학 분야에서도 그 중요성이 강조되나 학습용 한국어 생의학 말뭉치의 부족으로 AI를 활용한 한국어 임상 연구 발전에 제약이 되고 있다.
본 연구에서는 한국어 생의학 개체명 인식을 위해 새로운 생의학 말뭉치를 구축하고 대용량 한국어 말뭉치로 사전 학습된 언어 모델들을 선정하여 전이 학습시켰다. F1-score로 선정된 언어 모델의 개체명 인식 성능과 태그별 인식률을 비교하고 오류 분석을 하였다. 인식 성능에서는 KlueRoBERTa가 상대적인 좋은 성능을 보였다. 태깅 과정의 오류 분석 결과 Disease의 인식 성능은 우수하나 상대적으로 Body와 Treatment는 낮았다. 이는 문맥에 기반하여 제대로 개체명을 분류하지 못하는 과분할과 미분할로 인한 것으로, 잘못된 태깅들을 보완하기 위해서는 보다 정밀한 형태소 분석기와 풍부한 어휘사전 구축이 선행되어야 할 것이다.
영문 초록
The advent of transformer architectures in deep learning has been a major breakthrough in natural language processing research. Object name recognition is a branch of natural language processing and is an important research area for tasks such as information retrieval. It is also important in the biomedical field, but the lack of Korean biomedical corpora for training has limited the development of Korean clinical research using AI.
In this study, we built a new biomedical corpus for Korean biomedical entity name recognition and selected language models pre-trained on a large Korean corpus for transfer learning. We compared the name recognition performance of the selected language models by F1-score and the recognition rate by tag, and analyzed the errors. In terms of recognition performance, KlueRoBERTa showed relatively good performance. The error analysis of the tagging process shows that the recognition performance of Disease is excellent, but Body and Treatment are relatively low. This is due to over-segmentation and under-segmentation that fails to properly categorize entity names based on context, and it will be necessary to build a more precise morphological analyzer and a rich lexicon to compensate for the incorrect tagging.
목차
Ⅰ. 서 론
Ⅱ. NER 개념과 관련 연구
Ⅲ. 인식 성능 평가와 오류 분석
Ⅳ. 결론
References
키워드
해당간행물 수록 논문
- 한국전자통신학회 논문지 제19권 제4호 목차
- 리튬이온 배터리의 화재 시험을 통한 열 전달 메커니즘 및 손상 평가
- 육상 양식장 빅데이터 분석 시스템 개발을 위한 데이터 시각화 도구 개발
- 테이퍼된 스트립 선로로 급전된 광대역 프린트 1X2 다이폴 배열 안테나
- RS-422 통신과 임베디드 프로세서를 이용한 무장 조종간의 설계 및 평가
- 연속 이중 폐쇄 루프 완전 제어 전략 기반 직접 구동 풍력 전력망 연결 시스템 연구
- 철도산업에서 AI기반 예측 유지보수를 위한 사례 연구 및 시사점
- 한국어 생의학 개체명 인식 성능 비교와 오류 분석
- 생성형 인공지능(Generative AI)에 대한 지각된 가치와 지속이용의도 결정요인 탐색
- 합성곱 신경망을 이용한 종 수준의 동물플랑크톤 분류기 및 시각화
- 재가노인의 MCI예방을 위한 AI,메타버스와 재활운동 융합적 기대효과
- 정보보안 기술 스트레스와 조직 공정성이 준수 의도에 미치는 영향: 계획된 행동이론을 중심으로
- 사물 인터넷 기반의 스마트 터널 사고 경보 시스템
- AI 및 IoT 기반 스마트팜 병충해 예측시스템 개발: YOLOv5 및 Isolation Forest 모델 적용 연구
- 압력 및 가속도 센서를 활용한 운동 자세 교정 시스템
- 고추 작물의 정밀 질병 진단을 위한 딥러닝 모델 통합 연구: YOLOv8, ResNet50, Faster R-CNN의 성능 분석
- 비대칭 환경에서 듀얼홉 통신시스템의 자원할당 성능분석
- 가변 입력 전압 조건하에서 태양광 시스템 적용을 위한 승압형 DC-DC 컨버터 연구
- 스펙트로그램을 이용한 CNN 음성인식 모델
참고문헌
관련논문
공학 > 전자/정보통신공학분야 BEST
더보기공학 > 전자/정보통신공학분야 NEW
- 한국전자통신학회 논문지 제19권 제5호 목차
- WSN에서의 효율적 라우팅을 위한 에너지 기반 PEGASIS 프로토콜
- 분할 빔 기반 이중 빔 형성을 위한 반사배열안테나 시스템의 위상 가중치에 관한 연구
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!