학술논문
딥러닝 기반 언어모델을 이용한 한국어 학습자 쓰기 평가의 자동 점수 구간 분류 - KoBERT와 KoGPT2를 중심으로
이용수 0
- 영문명
- Automatic Score Range Classification of Korean Essays Using Deep Learning-based Korean Language Models : The Case of KoBERT & KoGPT2
- 발행기관
- 국제한국언어문화학회
- 저자명
- 조희련(Heeryeon Cho) 이유미(Yumi Yi) 임현열(Hyeonyeol Im) 차준우(Junwoo Cha) 이찬규(Chankyu Lee)
- 간행물 정보
- 『한국언어문화학』제18권 제1호, 217~241쪽, 전체 25쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2021.04.30
5,800원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
이 연구에서는 '한국어 딥러닝 모델'이 '한국어 학습자의 쓰기 자료에 대한 한국어 교사의 평가 점수'를 어느 정도 유사하게 예측할 수 있는지 살펴보았다. 구체적으로 이 연구에서는 304편의 한국어 쓰기 자료와 각각에 대한 평가 점수를 KoBERT와 KoGPT2로 학습시킨 후 그것이 인간 채점자(한국어 교사)의 평가 점수를 어느 정도 유사하게 예측하는지 실험하였다. 학습 데이터는 주제에 따라 '직업'과 '행복'으로 구분하였고, 점수에 따라 4종 레이블을 부착하였다. 7겹 교차 검증을 통한 실험 결과, KoBERT에서는 '직업' 데이터에서 48.8%, '행복' 데이터에서 65.2%의 분류 정확도를 나타냈다. KoGPT2에서는 같은 데이터에 대해 각각 50.6%와 58.9%의 분류 정확도를 나타냈다. 더불어, 모든 주제를 통합한 데이터에서는 KoBERT와 KoGPT2에 대해 각각 54.5%와 46.5%의 분류 정확도를 확인할 수 있었다. 이 연구를 통해 한국어 쓰기 자료에 대한 자동 채점 시스템의 가능성을 확인할 수 있었다. 향후 GPT-3의 한국어 모델이 개발되는 등의 기술 발전이 이루어진다면, 이 연구에서 시도한 한국어 자동 채점 시스템도 충분히 가능할 것으로 기대한다.
영문 초록
Automatic Score Range Classification of Korean Essays Using Deep Learning-based Korean Language Models-The Case of KoBERT & KoGPT2-. We investigate the performance of deep learning-based Korean language models on a task of automatically classifying Korean essays written by foreign students. We construct an experimental data set containing a total of 304 essays, which include essays discussing the criteria for choosing a job (‘job’), conditions of a happy life (‘happiness’), relationship between money and happiness, and definition of success. These essays were divided into four scoring levels, and using this 4-class data set, we fine-tuned two Korean deep learning-based language models, namely, KoBERT and KoGPT2, to use them in the automatic essay classification experiment. The 7-fold cross validation classification accuracies of ‘job’ and ‘happiness’ essays were 48.8% and 65.2% respectively for KoBERT, and 50.6% and 58.9% respectively for KoGPT2. Furthermore, the 7-fold cross validation classification accuracies of the integrated dataset that combined all essays were 54.5% and 46.5% for KoBERT and KoGPT2 respectively.
목차
1. 서론
2. 이론적 배경
3. 한국어 쓰기 답안지 자동 점수 구간 분류 실험
4. 실험 결과
5. 결론
참고문헌
키워드
해당간행물 수록 논문
- 온라인 한국어 교육 관련 연구 동향 분석 - 토픽 모델링과 언어 네트워크 분석을 중심으로
- 「한국언어문화학」의 연구 동향 - 네트워크 분석과 내용 분석의 활용
- 베트남어권 한국어 고급 학습자의 화용 습득 경험에 관한 연구
- 온라인 한국어 수업에서의 학습실재감과 학습 성과에 대한 연구 - 학습실재감, 만족도, 학습지속의향을 중심으로
- 해외 대학 한국어 프로그램과 전공의 안정적 발전을 위한 진단과 평가 - 미국 웰슬리 대학 한국어 프로그램의 사례 분석
- 태국인 근로자 대상 입국 후 단기 한국어 프로그램 개발 및 앱 설계를 위한 요구 분석
- 담화 능력 평가를 위한 채점기준표 개발 - 수행결정나무(PDT) 방식을 사용하여
- 딥러닝 기반 언어모델을 이용한 한국어 학습자 쓰기 평가의 자동 점수 구간 분류 - KoBERT와 KoGPT2를 중심으로
- 번역을 위한 한국어 교수-학습 방법 연구
- 한국어 학습자의 의지·의도 양태의 사용 양상에 대한 종적 연구
- 한국어 추측 표현과 양태 부사의 공기 양상에 대한 계량적 연구
- 몽골인 학습자의 한국문화 인식 조사 연구
참고문헌
관련논문
사회과학 > 교육학분야 BEST
더보기사회과학 > 교육학분야 NEW
- 온라인 한국어 교육 관련 연구 동향 분석 - 토픽 모델링과 언어 네트워크 분석을 중심으로
- 「한국언어문화학」의 연구 동향 - 네트워크 분석과 내용 분석의 활용
- 베트남어권 한국어 고급 학습자의 화용 습득 경험에 관한 연구
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!