학술논문
한국어 문장 수준 서답형 문항 자동채점 적용 가능성 탐색
이용수 506
- 영문명
- Analysis of Scoring Results in Korean Constructed Response Automatic Scoring Program
- 발행기관
- 한국교육평가학회
- 저자명
- 노은희(Noh Eun hee) 성경희(Sung Kyung hee) 임은영(Lim Eun Young)
- 간행물 정보
- 『교육평가연구』제28권 제2호, 523~551쪽, 전체 29쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2015.06.30
6,280원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구의 목적은 한국어 문장 수준 서답형 문항 자동채점 프로그램의 성능을 검증하여 대규모 평가에서의 적용 가능성을 탐색하기 위한 것이다. 2013년 학업성취도 평가 국어 9문항, 사회 2문항의 각 1000개 답안을 대상으로 시범 적용한 결과, 채점 정확성과 효율성을 중시하는 고부담 대규모 평가에 적정한 것으로 나타났다. 먼저, 채점 처리 과정의 간결성(simplicity) 측면에서, 1차로 답안을 군집화한 결과 답안 유형 수가 3.1%~37.5%로 감소한다. 이를 바탕으로 고빈도 답안을 채점하면 평균 55.9%의 답안이 채점되어 군집화가 답안 유형 수를 줄이고 동시에 기계학습에 필요한 충분한 수의 답안을 확보하게 함으로써 자동채점의 효율성에 기여한다. 다음으로 채점 결과의 정확성(accuracy) 분석을 위해, 기준점수와 자동채점 점수 간 상관관계와 일치도를 살펴본 결과 적정하게 우수한 것으로 나타났다. 두 점수 간의 평균제곱근편차는 0~0.55, 표준화된 평균제곱근편차는 0~0.2로나타나 자동채점 점수가 기준점수와 크게 다르지 않았다. 또한 두 점수 간 완전일치도는 91.5~100%, 카파계수는 0.8~1.00, 상관계수는 0.82~1.00으로 나타나, 대체로 모든 문항에 대한 계수가 0.8 이상으로 높은 수준의 일치도를 보여주었다.
영문 초록
The purpose of this research is to explore the possibility of using an automatic scoring system for sentence-level responses in large scale to enhance the efficiency of scoring constructed response items for large scale assessment. In order to enhance the simplicity of the scoring process, the answers were grouped based on similarity of meaning, and the grouped answers were scored with the automatic scoring program. These scored answers were used for machine-learning, to update the similarity in meaning for the next grouping of answers. This process is intended to decrease the number of grouped answers and to accumulate scoring results. Upon implementing the program using 11 social studies constructed response items in the Korean language from the NAEA 2013, the types of answers for each question diminished by 3.1%-37% for the initial grouping stage, and an average of 55.9% of the answers were scored at the first stage of grouping. Grouping answers by similarity in meaning enhanced simplicity of scoring while also contributing to improved accuracy. Next, in order to examine the program 's scoring accuracy, we calculated the exact agreement, correlation coefficients, and kappa coefficients between the criterion scores and the scores from the automatic scoring program for the sentence level, and it was revealed that the exact agreement between the two scores was 91.5-100%, the correlation coefficient was 0.82-1.00 and the Kappa coefficient was 0.8-1.00, which is fairly remarkable.
목차
요약
Ⅰ. 서론
Ⅱ. 한국어 문장 수준 서답형 문항 자동채점 프로그램 개발
Ⅲ. 자동채점 적용 대상 문항 및 분석 방법
Ⅳ. 자동채점 결과 분석
Ⅴ. 결론
참고문헌
키워드
해당간행물 수록 논문
- 문항배열순서와 성별이 피험자 능력추정의 정확성과 시험불안에 미치는 영향
- 등급반응모형과 일반화부분점수모형에서 능력 분포, 문항 반응 범주 수, 검사길이에 따른 문항 적합도 지수 수행 비교
- 한국어 문장 수준 서답형 문항 자동채점 적용 가능성 탐색
- 초등학생의 학업성취도를 예측하는 학생수준 및 학교수준 변인에 대한 다층 구조방정식모형 분석
- 역균형화 단일집단 설계를 사용하는 검사동등화에서 차별적 순서효과의 통계적 유의성 검정 및 검정력 분석
- A Comparison of IRT Calibration Methods in Growth Pattern and Scale Variability in Vertical Scaling
- 랜덤 포레스트
- 학업탄력성이 있는 학생들의 고교 및 대학생활 특성 분석
- 문항반응모형을 활용한 준거지향 교사효과성 추정
- 교사의 내ㆍ외적 요인과 교실평가 간의 구조적 관계: 한국, 싱가포르 및 핀란드 비교
- Bi-factor MIRT True-Score Equating for Testlet-Based Tests
- TIMSS 수학 성취 상위국의 수학 흥미와 자신감에 대한 학년 및 연도간 변화 분석
- Interaction between Effects of Content and Statistical Representations of Common Item Sets on Equating Accuracy
- A Comparison of Parameter Recovery in Multilevel Modeling Estimation: Maximum Likelihood versus Bayesian Estimation
- 청소년 생활역량 진단검사의 표준화 연구
- 자료에 이상점들이 존재할 때 매개효과 검정 방법들의 비교
- 사관생도들의 군사학 과정 루브릭에 대한 인식, 활용, 학습전략, 학업성취의 구조관계 분석
- 자료크기와 집단 간 피험자 수의 차이가 차별기능문항 추출의 제1종 오류에 미치는 영향
참고문헌
관련논문
사회과학 > 교육학분야 BEST
더보기사회과학 > 교육학분야 NEW
- 가정계열 선택과목에 대한 고등학생의 요구 분석
- 가정계열 선택과목에 대한 고등학생의 요구 분석 대한 토론
- 프레이리(Freire) 교육론 탐구를 통한 가정과교육의 철학적 함의에 대한 토론
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!