본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

데이터셋 분할 비율에 따른 머신러닝 기반의 전력 사용량 예측 성능 비교

이용수 7

영문명
Comparing the Machine Learning based Prediction Performance of Electricity Usage according to Dataset Splitting Ratios
발행기관
한국환경에너지공학회
저자명
이형아 김동주 임채영 여채온 구재희
간행물 정보
『한국환경에너지공학회 학술대회지』2022년 추계학술발표회, 427~427쪽, 전체 1쪽
주제분류
공학 > 환경공학
파일형태
PDF
발행일자
2022.12.08
무료

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

최근 인공지능을 활용한 빅데이터 분석 및 머신 러닝 기반의 예측 연구가 활발히 진행되고 있다. 특히 에 너지 소비 현황 분석 및 수요 예측을 통해 건 물 에너지와 시스템 제어의 효율화 기 술로서 활용되고 있다. 이 는 확보 가능한 데이터를 활용해 모델을 훈련 시 킬 수 있다는 강점을 가지며 , 기존의 방식보다 진보된 방식으로 건물의 최적 운영 에 효율적이다. 머신러닝 모델을 학습시키기 전, 데이터 전처리 단계에서 데이터셋을 훈련 데이터셋(train dataset)과 테스트 데이터셋 (test dataset)으로 분리하여 야 한다. 훈련 데이터셋은 모델을 학습시키 기 위해 사용되는 반면, 홀드아웃 데이터셋 (holdout dataset) 이라고도 불리는 테스트 데이터셋은 신경망을 훈련 시 키는 데에는 사용되지 않고 모델 성능의 평가에만 사용되게 된다. 이와 같은 데이터셋의 분할을 통해 과대 적합을 방지하고 편향되지 않은 데이터로 모델 성능을 평가할 수 있다. 데이터셋의 분할 비율에 대한 기준은 없으며, 기존 수행된 연구를 확인해보면 일반적으로 훈련 데이터셋을 70-90%, 테스트 데이터셋울 l0~30%로 구성하는 것을 알 수 있다. 본 연구에서는 머신러닝 알고리즘 중 ANN의 MLP Regressor을 활용하여 한 식품공장의 전력 사용량을 예측하고자 한다. 해당 예 측 모델에 적합한 데이터셋 분할 비율을 도출하기 위 해 학습 데이터 의 비율을 10%부터 90%까지 10% 간격으로 조정하여 9가지 케이스에 대해 전력 사용량 예측 성능을 확인 하였다. 예측 성능은 CvRMSE(Coefficient of Variation of Root Mean Square Error)와 한로 확인하였다

영문 초록

목차

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이형아,김동주,임채영,여채온,구재희. (2022).데이터셋 분할 비율에 따른 머신러닝 기반의 전력 사용량 예측 성능 비교. 한국환경에너지공학회 학술대회지, 2022 (2), 427-427

MLA

이형아,김동주,임채영,여채온,구재희. "데이터셋 분할 비율에 따른 머신러닝 기반의 전력 사용량 예측 성능 비교." 한국환경에너지공학회 학술대회지, 2022.2(2022): 427-427

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제