본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

사회언어학 연구를 위한 한국어 미세조정 언어모델

이용수 0

영문명
Fine-tuned Korean Language Models for Sociolinguistic Studies
발행기관
한국사회언어학회
저자명
노강산(Kangsan Noh) 김수연(Soo-Yeon Kim) 최혜원(Hye-Won Choi) 장하연(Hayeun Jang) 송상헌(Sanghoun Song)
간행물 정보
『사회언어학』제32권 3호, 41~64쪽, 전체 24쪽
주제분류
어문학 > 언어학
파일형태
PDF
발행일자
2024.09.30
5,680

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

This paper aims to test deep-learning-based Korean language models’ capacity to learn and detect social registers embedded in speech data, specifically age, gender, and regional dialects. A comprehensive understanding of linguistic phenomena requires contextualizing speech based on speakers’ age, gender, and geographic background, along with the processing of syntactic structures. To bridge the gap between human language understanding and model processing, we fine-tuned three representative Korean language models—KR-BERT, KoELECTRA-base, and KLUE-RoBERTa-base—using transcribed data from 4,000 hours of speech by middle-aged and elderly Korean speakers. The findings reveal that KoELECTRA-base outperformed the other two models across all social registers, which is likely attributed to its larger vocabulary and parameters size. Among the dialects, the Jeju dialect showed the highest accuracy in inference, which is attributed to its distinctiveness, making it easier for the models to detect. In addition to the fine-tuning process, we have made our fine-tuned models publicly available to support researchers interested in Korean computational sociolinguistics.

영문 초록

목차

1. 서론
2. 배경
3. 방법
4. 결과
5. 논의
6. 결론
참고문헌

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

노강산(Kangsan Noh),김수연(Soo-Yeon Kim),최혜원(Hye-Won Choi),장하연(Hayeun Jang),송상헌(Sanghoun Song). (2024).사회언어학 연구를 위한 한국어 미세조정 언어모델. 사회언어학, 32 (3), 41-64

MLA

노강산(Kangsan Noh),김수연(Soo-Yeon Kim),최혜원(Hye-Won Choi),장하연(Hayeun Jang),송상헌(Sanghoun Song). "사회언어학 연구를 위한 한국어 미세조정 언어모델." 사회언어학, 32.3(2024): 41-64

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제