학술논문
채점자질의 적용이 영어 자동채점 모델의 성능에 미치는 영향
이용수 271
- 영문명
- Effects of Scoring Features on the Accuracy of the Automated Scoring Model of English
- 발행기관
- 한국교원대학교 교육연구원
- 저자명
- 신동광
- 간행물 정보
- 『교원교육』제38권 제6호, 73~91쪽, 전체 19쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2022.11.30
5,080원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
연구목적 본 연구는 채점자질(rating features)을 적용하는 자동채점 모델과 채점자질을 사용하지 않는 자동채점 모델 간의 성능을 비교하는 데 목적이 있다. 연구방법 연구에 활용된 데이터는 kaggle 사이트에서 다운로드 받은 영어 원어민 10학년 수준의 학습자들이 작성한 300개의 에세이 답안이며 이를 7:3의 비율로 학습 용 데이터와 검증용 데이터로 구분하였다. 답안은 사전에 인간 채점자들이 이미 6개 채점영역별로 0~6점의 척도에 기반한 채점기준표를 활용하여 분석적 채점을 수행한 데이터였다. 데이터 분류 결과, 에세이 답안이 극히 희소한 점수대는 인공지능 학습이사실상 불가능하여 제외하고 3~5점대 답안만 실험에 활용하였다. 먼저 채점자질을 활용할 수 있는 랜덤포레스트(RF) 모델을 활용하여 Coh-Metrix 분석에서 추출한 106개 언어자질값을 기계학습시켜 자동채점 결과를 산출하였다. 그 다음, 채점자질을 사용하지 않는 딥러닝 계열의 3개 모델인 순환신경망(RNN), 장단기기억(LSTM), 게이트순환유닛(GRU)에 기반한 자동채점 결과를 산출하였다. 이를 바탕으로 4개 자동채점모델 및 인간 채점의 결과에 대해 정확도(accuracy)를 기준으로 일치 정도를 비교하였다. 끝으로 랜덤포레스트 모델의 경우 어떠한 채점자질이 채점 결과에 영향을 미치는 주요 요인인지를 추가 분석하였다. 연구결과 딥러닝 계열인 RNN의 경우는 인간 채점 결과와의 일치도가 채점영역별로 .39~.69(평균=.58)로 나타났고 LSTM은 .59~.72(평균=.64), GRU는 .59~.72(평균=.64)로 나타났다. 반면 채점자질을 기계학습한 RF의 정확도 결과는 .60~.76(평균=.69)로 인간 채점 결과와 가장 높은 일치도를 보였다. RF 모델의경우 ‘단어수,’ ‘문장수,’ ‘어휘밀도’ 등이 전체 채점영역에서 공통적으로 주요한 자질로 나타났으며 각채점영역의 특성이 반영된 주요 채점자질들도 다수 확인되었다. 결론 대규모의 데이터 확보가 어려운 상황에서는 RF 모델이 상대적으로 높은 자동채점 성능을 보였으며 자동채점 결과의 활용 면에서도 채점자질의 분석값에 기반한 교수⋅학습적 피드백 제공이 가능한 RF 방식이 타 채점 보델과 비교하여 상대적으로 더 유용할 것으로 판단된다.
영문 초록
Purpose: This study attempted to compare the performance of an automated scoring model based on scoring features and three other automated scoring models that do not use the scoring feature. Methods: The data used in this study were 300 essays written by native English speakers in the tenth grade, which were divided into training and validating data at a ratio of 7:3. The RF model was used to predict the scores of the essays based on the analysis of 106 linguistic features extracted from Coh-Metrix. The accuracy of this model was compared to that of three deep learning models― RNN, LSTM, and GRU―which do not use those scoring features. Lastly, in the case of the RF model, scoring features mainly affecting accuracy prediction were further analyzed. Results: RNN which is a type of deep learning had an agreement with human scoring results ranging from .39 to .69 (mean=.58) in each rating domain, while LSTM showed an agreement between .59 and .72 (mean=.64), and GRU’s agreement was between .59 and .72 (mean=.64). However, when using the RF model based on the scoring features, its average accuracy was between .60 to .76 (mean=.69), which is the highest agreement among the four models. In the case of the RF model, ‘word count,’ ‘sentence count,’ and ‘vocabulary density’ were common characteristics across all scoring domains, but several scoring features reflecting the characteristics of each scoring domain were also found. Conclusion: When large-scale data is not available, the RF model showed relatively high automated scoring performance, and the RF model that provides learners with pedagogical feedback based on scoring features would be more useful compared to the other three automated scoring models in terms of the utilization of the automated scoring result.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구방법
Ⅳ. 연구결과 및 논의
Ⅴ. 결론
참고문헌
키워드
해당간행물 수록 논문
- 교원교육 제38권 제6호 목차
- 채점자질의 적용이 영어 자동채점 모델의 성능에 미치는 영향
- CIPP 평가모형 기반 의과대학 CQI 프로그램 개선 연구
- 교사의 교육 ODA 수행 경험의 특징 탐색
- 2022 개정 초등 도덕과 교육과정에서 평가에 대한 일고찰
- 교사의 전문적자본과 교사효능감 관계 분석
- 일반계 고등학생의 불확실성에 대한 인내력 부족과 진로미결정 관계에서 역기능적 진로사고 매개효과 검증
- 교육실습이 초등교사 성장에 부여하는 의미
- 한국, 중국, 일본의 초중등학교 비교과 교육과정 비교
- A Qualitative Case Study on the Experiences of Korean Early Childhood Teacher Educators Enacting Multicultural Social Justice Education in the U.S. -Focusing on Their Dilemmas-
- 중국 조선어문 과정에서 판소리의 교육적 적용
- 이야기 그림책 활용 영어교육을 위한 독자 반응 분석 준거 구안
- 대학원 과정 특수교육 전공생의 학습장애 학생 지도 역량 강화 방안에 대한 기초 연구
- 국악교육 사상에 담긴 생태전환적 가치와 적용 방향
- 예비전문상담교사 교육실습 개선을 위한 델파이 연구
- 혁신학교 정책에 대한 다차원적 IPA 분석
- 초기 사립 혁신학교에서 혁신문화 정착 과정에 대한 문화기술지
- 교사의 디지털 리터러시, 학교장의 변혁적 지도성이 교사 몰입을 매개로 ICT 수업 혁신행동에 미치는 영향
- 교사의 적응적 실행에 대한 선행연구 분석
- 중학생 협동역량의 발달궤적과 부모양육태도, 또래관계, 교사관계의 동시효과와 지연효과
- 대학교원의 성역할 인식척도 개발과 타당화 연구
참고문헌
관련논문
사회과학 > 교육학분야 BEST
더보기사회과학 > 교육학분야 NEW
- 국가 차원 인재양성 정책의 실효성 제고를 위한 「국가인재양성기본법」 제정 방안
- 고교 성취평가제 도입의 공공가치 분석: Bozeman의 공공가치 실패 모형을 중심으로
- 교육의 정치적 중립성의 헌법 편입과 제도화 연구
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
