본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

입력변수 구성에 따른 총유기탄소(TOC) 예측 머신러닝 모형의 성능 비교

이용수 0

영문명
Comparison of the Performance of Machine Learning Models for TOC Prediction Based on Input Variable Composition
발행기관
유기성자원학회
저자명
이소현(Sohyun Lee) 박정수(Jungsu Park)
간행물 정보
『유기물자원화』제32권 제3호, 19~29쪽, 전체 11쪽
주제분류
공학 > 환경공학
파일형태
PDF
발행일자
2024.09.30
4,120

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

총 유기 탄소 (total organic carbon, TOC)는 물에 포함된 유기 탄소의 총량을 나타내며 BOD, COD와 함께수중의 유기물질량에 대한 정량적인 지표로 활용되는 대표적인 수질 항목이다. 본 연구에서는 대표적인 앙상블(ensemble) 머신러닝 알고리즘의 하나인 XGBoost (XGB)를 이용하여 TOC를 예측하는 모형을 구축하였다. 모형의구축을 위한 독립변수로는 수온, pH, 전기전도도, 용존 산소 농도, 생물화학적 산소요구량, 화학적 산소요구량, 부유물질, 총질소, 총인 및 유량을 활용하였다. 또한 모형의 구축에 활용된 다양한 수질 항목의 영향에 대한 정량적인분석을 위해 입력변수의 feature importance를 산정하였으며, 이를 기반으로 변수중요도에 따라 중요도가 낮은 항목을 순차적으로 제외하여 모형의 성능 변화를 분석하였다. 변수중요도가 낮은 항목을 순차적으로 제외하여 구축한모형의 성능은 RSR (root mean squared error-observation standard deviation ratio) 0.53~0.55의 범위를 보였으며, 전체입력변수를 적용한 모형의 RSR 값은 0.53로 가장 우수한 성능을 보이는 것으로 분석되었다. 또한 모형의 현장적용성을 높이기 위해 현장 측정이 상대적으로 용이한 측정항목을 중심으로 모형을 구축하고 성능을 분석하였다. 분석결과 상대적으로 측정이 용이한 항목인 수온, pH, 전기전도도, 용존산소농도, 부유물질농도만으로 구축된 모형의경우에도 RSR 값이 0.72로 분석되어 상대적으로 측정이 용이한 현장 수질측정항목만을 이용하는 경우에도 안정적인성능의 확보가 가능할 수 있음을 확인하였다.

영문 초록

Total organic carbon (TOC) represents the total amount of organic carbon contained in water and is a key water quality parameter used, along with biochemical oxygen demand (BOD) and chemical oxygen demand (COD), to quantify the amount of organic matter in water. In this study, a model to predict TOC was developed using XGBoost (XGB), a representative ensemble machine learning algorithm. Independent variables for model construction included water temperature, pH, electrical conductivity, dissolved oxygen concentration, BOD, COD, suspended solids, total nitrogen, total phosphorus, and discharge. To quantitatively analyze the impact of various water quality parameters used in model construction, the feature importance of input variables was calculated. Based on the results of feature importance analysis, items with low importance were sequentially excluded to observe changes in model performance. When built by sequentially excluding items with low importance, the performance of the model showed a root mean squared error-observation standard deviation ratio (RSR) range of 0.53 to 0.55. The model that applied all input variables showed the best performance with an RSR value of 0.53. To enhance the model's field applicability, models using relatively easily measurable parameters were also built, and the performance changes were analyzed. The results showed that a model constructed using only the relatively easily measurable parameters of water temperature, electrical conductivity, pH, dissolved oxygen concentration, and suspended solids had an RSR of 0.72. This indicates that stable performance can be achieved using relatively easily measurable field water quality parameters.

목차

1. 서 론
2. 재료 및 방법
3. 결과 및 고찰
4. 결 론
사 사
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이소현(Sohyun Lee),박정수(Jungsu Park). (2024).입력변수 구성에 따른 총유기탄소(TOC) 예측 머신러닝 모형의 성능 비교. 유기물자원화, 32 (3), 19-29

MLA

이소현(Sohyun Lee),박정수(Jungsu Park). "입력변수 구성에 따른 총유기탄소(TOC) 예측 머신러닝 모형의 성능 비교." 유기물자원화, 32.3(2024): 19-29

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제