본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

XGBoost 앙상블에 의한 서울시 초미세먼지 예측

이용수 265

영문명
The Prediction of PM2.5 in Seoul through XGBoost ensemble
발행기관
한국자료분석학회
저자명
김혁(Hyeuk Kim)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.22 No.4, 1661~1671쪽, 전체 11쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2020.08.30
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

미세먼지는 사람의 건강에 많은 영향을 미치는 물질로서 환경과 건강에 대한 관심이 높아지면서 이와 관련하여 다양한 연구가 이루어지고 있다. 대기환경 분야에서는 전통적으로 수치모형을 이용하여 미세먼지와 관련된 연구를 수행하였으나 기계학습 분야가 발달함에 따라 최근 들어 기계학습을 이용한 연구도 수행하고 있다. 본 연구는 초미세먼지 농도의 예측에 관한 연구로서 기존의 연구들이 대부분 단기(1시간~2일 후) 예측에 그치는데 반해 중기(1주일 후) 예측을 시도하고 있다. 서울지역의 일평균 초미세먼지 농도를 보통(36βm미만)과 나쁨(36βm이상)의 이 단계로 나누어 이를 예측하는 분류모형을 만들었다. 분류모형으로는 XGBoost를 사용하였으며 모형의 성능 극대화를 위하여 각기 다른 평가지표를 기준으로 초모수 최적화(hyperparameter optimization)를 시도한 개별 모형들을 만든 후 앙상블 모형을 구축하였다. 2016년부터 2018년까지 3년의 자료를 이용하여 모형을 훈련시킨 후 2019년 1월부터 6월까지의 서울시 일 평균 미세먼지농도를 예측한 결과 단일 모형보다 본 연구에서 제시한 앙상블 모형의 성능이 좋음을 확인하였다. 또한 미세먼지의 등급이 나쁜 경우보다 보통인 경우가 횔씬 많은 것을 고려하여 범주의 불균형 상태를 보완하는 방법을 적용하였으나 환경물질 자료만 설명변수로 사용할 때는 효과적이나 환경물질과 기상 정보에 관한 변수들을 모두 사용할 때는 오히려 모형의 성능에 악영향을 가져오는 것을 확인하였다.

영문 초록

Fine dust is a substance that greatly affects human health, and as interest in the environment and health increases, various studies have been conducted in this regard. In the field of atmospheric environment, studies related to fine dust have been traditionally performed using numerical models, but the research based on the machine learning has been conducted recently as the field of machine learning has developed. This study is about the prediction of ultrafine dust concentration, and it attempts to predict the middle (after 1 week) prediction while most of the existing studies are only short-term (after 1 hour to 2 days) prediction. A classification model was develeped to predict the average daily ultrafine dust concentration in Seoul by dividing it into two stages: normal (less than 36) and bad (more than 36). XGBoost was used as the classification model and an ensemble model was constructed after creating individual models through the hyperparameter optimization based on different evaluation indicators in order to maximize the performance of the model. The average daily fine dust concentration in Seoul from January to June 2019 was predicted after training the model using data from 2016 to 2018, and the performance of the ensemble model presented in this study was higher than that of a single model. In addition, the method of imbalance problem was applied since the number of cases where the level of fine dust is bad is much less than the number of cases where the level of fine dust is normal. It works effectively when only environmental material data is used as explanatory variables, but it adversely affects the performance of the model when both variables related to environmental materials and weather information are used.

목차

1. 서론
2. 선행연구
3. 연구 방법
4. 모형 적용 결과
5. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김혁(Hyeuk Kim). (2020).XGBoost 앙상블에 의한 서울시 초미세먼지 예측. Journal of The Korean Data Analysis Society (JKDAS), 22 (4), 1661-1671

MLA

김혁(Hyeuk Kim). "XGBoost 앙상블에 의한 서울시 초미세먼지 예측." Journal of The Korean Data Analysis Society (JKDAS), 22.4(2020): 1661-1671

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제