학술논문
랜덤 포레스트
이용수 4284
- 영문명
- Random forests, an alternative data mining technique to decision tree
- 발행기관
- 한국교육평가학회
- 저자명
- 유진은(Yoo Jin Eun)
- 간행물 정보
- 『교육평가연구』제28권 제2호, 427~448쪽, 전체 22쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2015.06.30
5,440원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
랜덤 포레스트는 최근 관심의 대상이 되고 있는 데이터 마이닝 기법으로, 의사결정나무 모형을 기저로 하며 무작위성을 최대로 부여함으로써 예측오차를 줄인다. 본 연구에서는 의사결정나무와 랜덤 포레스트의 이론적 배경, 특징, 장단점 등을 설명하고, 한국청소년패널조사(KYPS VI) 자료를 이용하여 두 기법을 비교ㆍ분석하였다. 랜덤 포레스트는 특히 설명변수 개수가 많은 고차원 자료의 경우 예측력이 매우 높다는 장점이 있다. 연구 결과, 조율모수에 대한 고민 없이도 랜덤 포레스트의 정분류율이 가지치기 후 의사결정나무의 정분류율과 비슷하였다. 랜덤 포레스트와 같은 방법은 기존 통계분석 방법으로 처리하기 힘든 빅데이터 뿐만 아니라, 회귀모형, 분류, 생존분석 등을 망라하는 기존 통계분석 방법으로 처리할 수 있는 자료에도 적용될 수 있다. 생물의학, 데이터베이스 마케팅, 신용평가, 금융예측 등의 다양한 분야에서 랜덤 포레스트 기법이 활발하게 적용되며 연구되고 있는 반면, 2015년 현재 교육 관련 연구에서 랜덤 포레스트 방법은 아직 제대로 소개조차 되지 못했다. 이러한 현실에서 앞으로 우리 교육 관련 연구에서의 랜덤 포레스트 기법 확산에 본 연구가 도움이 될 수 있기를 기대한다.
영문 초록
Random forests, a data mining technique, recently has been gaining popularity in various fields of study, including bioinformatics, database marketing, credit scoring, and etc. Random forests, consisting of a number of decision trees, reduces prediction error via maximizing randomness. This study investigated the strengths and weaknesses of decision tree modeling and random forests, respectively, and examined the statistical properties of the two techniques with KYPS VI panel data. A well-known strength of random forests is its high prediction rates, particularly with high dimensional data, which was consistent with the results of this study. The accuracy of the random forests, without special considerations on its tuning parameters, was similar to that of the decision tree after pruning. Random forests can also be used for regression, classification, and survival analysis, as well as for big data techniques. This study aims to spread this superior technique, random forests, to professionals in education and others.
목차
요약
Ⅰ. 서론
Ⅱ. 랜덤 포레스트
Ⅲ. 자료 분석
Ⅳ. 결론 및 논의
참고문헌
키워드
해당간행물 수록 논문
- 문항배열순서와 성별이 피험자 능력추정의 정확성과 시험불안에 미치는 영향
- 등급반응모형과 일반화부분점수모형에서 능력 분포, 문항 반응 범주 수, 검사길이에 따른 문항 적합도 지수 수행 비교
- 한국어 문장 수준 서답형 문항 자동채점 적용 가능성 탐색
- 초등학생의 학업성취도를 예측하는 학생수준 및 학교수준 변인에 대한 다층 구조방정식모형 분석
- 역균형화 단일집단 설계를 사용하는 검사동등화에서 차별적 순서효과의 통계적 유의성 검정 및 검정력 분석
- A Comparison of IRT Calibration Methods in Growth Pattern and Scale Variability in Vertical Scaling
- 랜덤 포레스트
- 학업탄력성이 있는 학생들의 고교 및 대학생활 특성 분석
- 문항반응모형을 활용한 준거지향 교사효과성 추정
- 교사의 내ㆍ외적 요인과 교실평가 간의 구조적 관계: 한국, 싱가포르 및 핀란드 비교
- Bi-factor MIRT True-Score Equating for Testlet-Based Tests
- TIMSS 수학 성취 상위국의 수학 흥미와 자신감에 대한 학년 및 연도간 변화 분석
- Interaction between Effects of Content and Statistical Representations of Common Item Sets on Equating Accuracy
- A Comparison of Parameter Recovery in Multilevel Modeling Estimation: Maximum Likelihood versus Bayesian Estimation
- 청소년 생활역량 진단검사의 표준화 연구
- 자료에 이상점들이 존재할 때 매개효과 검정 방법들의 비교
- 사관생도들의 군사학 과정 루브릭에 대한 인식, 활용, 학습전략, 학업성취의 구조관계 분석
- 자료크기와 집단 간 피험자 수의 차이가 차별기능문항 추출의 제1종 오류에 미치는 영향
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!