수자원관리 분야에서 자주 쓰이는 딥러닝 기술
Shen(2018)은 수자원관리에 많이 사용되는 MLP(Multilayer Perceptron, 다층 퍼셉트론, 이하 MLP), 합성곱신경망(Convolutional Neural Network, 이하 CNN), Auto Encoder(오토인코더, 이하 AE), AE가 누적된 형태인 SDAE(Stacked AE), DBN(Deep Belief Net, 심층신뢰망), RNN(Recursive Neural Network)를 개선한 LSTM(Long Short Term Memory)을 들고 있다. 본 고에서는 우리나라에서도 수위 예측 등에 자주 사용되고 있는 Deep AR 등을 추가로 논의하고, 우리나라 수자원 분야에서 사용되고 있는 예를 찾기 힘든 DBN을 제외하고 그 개념에 대해 간단히 설명한다.
MLP(다층 퍼셉트론)는 여러 개의 퍼셉트론 뉴런을 여러 층으로 쌓은 다층신경망 구조다. 입력층(input layer)과 출력층(output layer) 사이에 하나 이상의 은닉층(hidden layer)을 가지고 있는 신경망이다. 가장 기본적인 딥러닝 신경망으로, 인접한 두 층의 뉴런은 완전연결(fully connected)된다. 오토인코더(AutoEncoder)는 이상징후(Anomaly)를 탐지하는 데 자주 쓰인다. 은닉층의 뉴런 수를 입력층보다 작게 해서 데이터를 압축(차원을 축소)한다는 것이 가장 큰 특징이다. 이후 디코더에서 노이즈(noise)를 추가한 후 원본 입력을 복원할 수 있도록 네트워크를 학습시킨다. Stacked AutoEncoder(SDAE)는 각 단계에서 오토인코더를 쌓아간다는 특징이 있다. 보통의 오토인코더는 SDAE의 형태로 운영된다. 각 단계에서 계층의 수를 변경하여 최적의 파라미터를 얻을 수 있다. CNN(합성곱신경망)은 이미지 처리에 많이 사용되고, 이름에서 알 수 있듯이 “Convolution”이라는 작업이 들어간 뉴럴네트워크(NN)이다. 이는 필터(filter)를 통해서 전체를 보는 것이 아니라 중심적인 특징에 집중할 수 있도록 한다. 이후 pooling layer, fully connected layer의 구조로 이루어진다. 순환신경망(Recurrent Neural Network, 이하 RNN)은 자연어와 같이 순서가 중요한 모델에서 시작하였다. LSTM(Long Short Term Memory)은 기존의 RNN(순환신경망)이 출력과 먼 위치에 있는 정보를 기억할 수 없다는 단점을 보완하여 장·단기 기억을 가능하게 설계한 신경망의 구조를 말한다. 주로 시계열 처리나 자연어 처리에 사용된다. Deep AR은 RNN을 사용하여 스칼라(1차원) 시계열을 예상하는 지도학습 알고리즘이다. 기존 ARIMA(Autoregressive Integrated Moving Average) 모델이나 지수평활법 같은 일반적인 예상 방법보다 20% 정도 더 나은 결과를 산출하고 있다(Salinas D., Flunkert & Gasthaus, 2020).
그림 1. 인공지능, 기계학습, 딥러닝의 관계
그림 2. 수자원관리에서 활용되는 대표적 딥러닝 기법의 기본 작동원리
딥러닝 적용 연구와 실용화
딥러닝을 적용하는 가장 큰 이유는 딥러닝이 아닌 기법보다 더 나은 결과가 나올 수 있다고 판단하기 때문이다. 물론 딥러닝 기법 내에서도 자료의 특성이나 산업 분야에 따라 다르게 나타날 수 있어 일반화하기는 어렵다. 아래에서는 각 분야에서의 적용 사례에 대해 간략히 살펴본다.
수질의 예측 및 이상징후 탐지
깨끗한 물을 제공하기 위해 상수도의 수질의 안전성을 강화하는 것이 중요하다. 하수도 분야에서도 하수처리장에서 배출되는 유출수가 정상적인 범위 내의 품질을 유지할 수 있도록 관리해야 한다. 환경부 등에서 추진하는 스마트정수장, 스마트 하수처리장은 주로 사물인터넷(Internet of Things) 기술을 활용하여 실시간 측정과 모니터링에 중점을 둔 시스템이다. 따라서 이는 엄밀히 말하면 빅데이터 기반의 시스템이고 딥러닝 기술 등이 직접 적용된, 진정한 의미에서 스마트한 정수장 또는 처리장은 아니라 할 수 있다.
김기태 외(2021)와 김진영 외(2021)에서는 딥러닝이 아닌 인공지능을 이용한 기술을 적용하여 정수장의 수질을 예측하는 인공지능을 소개하였다. 김태우·이호식(2019)은 딥러닝을 포함한 인공지능의 하수처리시설 적용 가능성을 논의하였으나 실제 구현 사례는 제시하지 못했다. Abba, Nourani & Elkian(2019)는 나이지리아의 하수처리장에서의 탁도, 산도(pH) 등을 예측하면서 다양한 서포트벡터머신, 뉴럴네트워크 모델, 선형자기회귀, Hammerstein-Wiener 모델 등의 다양한 방법을 사용하여 그 성능을 비교하였다.
현재 우리나라에서는 그린텍아이엔씨가 하수처리장 내의 각 수조에서 총인(TP), 총질소(TN), COD, BOD 등을 일반적 머신러닝과 딥러닝 기법을 사용하여 예측하고 관리하는 솔루션을 개발하고 있다(한국데이터경제신문, 2022.04.29.). 수질을 정상과 이상으로 이진분류할 것인지, 수질을 예측하여 그 예측 범위 내에서 이상과 정상을 식별할 것인지에 대한 이슈가 있다. 정상과 이상으로 이진분류하기 위해서는 그 기준에 대한 주석(Annotation 또는 Tagging)이 필요하다. 이에 따라 태깅이 필요 없는 예측을 통해서 사후적으로 기준을 통계적으로 부여하거나 AE 등의 비지도학습이 선호된다.
수위·수량의 예측 및 이상징후 탐지
수위 또는 수량의 예측은 비교적 단순한 시계열 예측이 주를 이룬다. 시계열로는 LSTM 또는 Deep AR 등을 사용한 예측이 사용된다. LSTM 모델은 한강, 메콩강, 태화강 등의 다양한 수계의 수위 예측 등에 비교적 많이 사용되고 있다.
LSTM을 이용하여 메콩강 하류 Kratie 지점의 유량 연구(정성호 외, 2021)에서는 물리 기반의 수문모형인 SWAT(Soil and Water Assessment Tool)의 성능을 비교하였다. SWAT 모형에 비하여 상대오차율, 최대 및 최소 오차율도 상대적으로 낮아서 안정성을 보였다. LSTM이 선행자료를 기억하고 예측에 활용할 수 있어 복잡한 수문자료의 시계열적 해석에 대한 보완 또는 대체 가능성을 제기했다.
Deep AR은 비교적 최근부터 사용되기 시작하였으며 도심 홍수의 예측, 수계의 수위 예측 등에 사용되고 있다. 주로 학술 연구 수준에서 다루어지고 있다. 상용화 사례는 극히 드물다. 하수관거의 수위를 예측하는 솔루션을 보유한 한국융합아이티에서 기존 솔루션에 Deep AR을 이용한 예측모델을 추가하고 있다.(인공지능신문, 2022.04.27.) 아이브랩은 상수도 분야에서 누수와 사용량 예측을 위해 솔루션을 도입했다(ZDnet Korea, 2020.11.03.). 여기에는 랜덤포레스트와 같은 머신러닝 기법과 함께 LSTM 등의 딥러닝 기술이 사용되었다.
상하수관의 관리
상하수도 관로의 노후화에 따라 운영 및 유지관리 비용이 증가하고 있다. 상수도의 경우 21년 이상된 관로가 지방상수도는 약 33%, 광역상수도는 약 39%를 차지하고 있다. 이 분야에서 학문적 연구는 찾기 어렵다. 실제 가장 많이 이용되고 있는 부분은 상수도 누수관리 분야다. 한국수자원공사에서는 딥러닝 기반으로 광역상수도의 유량과 압력 데이터 등의 학습자료를 바탕으로 급격한 수치변동 등 이상상태를 확인할 수 있는 시스템을 개발하였다(대한전문건설신문, 2020.11.12.). 이와 관련하여 AI 허브에서도 상수관로 누수 감지를 위한 인공지능 학습데이터 셋을 2021년 6월에 공개하였다. 이렇게 대량의 학습자료가 제공되면서 관련된 연구와 상용화는 더욱 가속될 것으로 기대된다.
한편 하수도 분야에서는 서울시에서 학습이미지를 제공하고 있다. 서울디지털재단에서는 이러한 자료를 바탕으로 “인공지능 기반 하수관로 결함탐지 시스템”을 개발하였다(물산업신문, 2021). 이때 CNN 모델의 일종인 VGG-19를 사용하였다. 이 연구는 4개월이라는 짧은 기간에 수행되었지만 기존 2년 동안 수행된 연구에 비해 높은 인식률을 기록했다. 즉 기존 90%의 인식률이 95.2%로 5.2%가 개선된 것이다(고설태·문현준 외, 2020).
그림 3. 서울열린데이터 광장에 공개된 하수관로 이미지
딥러닝 이용의 활성화를 위한 제언
딥러닝은 기후변화, 수문관리 등에서 폭넓게 이용되고 있다. 우리나라 상하수도 분야에서도 2020년 이후 적용하고자 하는 움직임이 있으나 시범 적용되는 경우가 대부분이다. 이는 인공지능에 대한 신뢰의 문제이기도 하다. 하나의 현장에서 수립된 인공지능을 일반화하여 적용하는 데에는 한계가 있다. 인공지능의 학습이 하나의 현장 자료에 과적합(over fit)되어 다른 곳에서는 정확성이 낮아질 수 있다. 이런 문제점을 해결하기 위해서는 모델에 대한 지속적인 학습이 따라야 한다. 학습자료가 필요한 것이다. 사실 학습자료는 넘쳐나지만 공개된 자료는 충분하지 못하다.
예를 들어 하수처리장의 유입 수질과 유출 수질은 공개되고 있다. 일반인이라면 하루에 한 번 측정되는 자료로 충분하다. 그러나 산업적인 측면에서는 하수처리장의 수조별로 자료가 필요하다. 그래야 각 수조에서 송풍량을 어떻게 할 것인지, 화학물질을 얼마나 넣을 것인지를 인공지능으로 학습하고 제어하는 모델을 만들 수 있다. 측정단위도 하루가 아닌 분 단위, 시 단위 등 좀 더 구체적인 자료가 더욱 도움이 된다.
이미 스마트하수처리장 사업 등으로 가능하지만 공개되고 있지는 못하다. 따라서 이들에 대해서 공개요청이 있기 전에 선제 개방이 필요하다. 또한 한국수자원공사나 서울디지털재단 등의 공기업 및 공공기관 중심의 개발도 중요하지만 기존 물관리 기업과 인공지능 기업이 협력하는 생태계 구축이 필요하다.
참고문헌
<논문 및 보고서>
고설태·문현준 외(2020), 인공지능 기반 하수관로 결함탐지 알고리즘 개발 연구, 서울디지털재단.
김기태·민병원·연용호·오용선.(2021). 약품 주입 정수처리공정 자율운영을 위한 데이터 분석 모델 설계분석. 한국콘텐츠학회 종합학술대회 논문집, 23-24.
김진영·강복선·정회경.(2021). K-means 알고리즘과 GBR 알고리즘을 이용한 정수장 응집제 투입률 결정 기법. 한국정보통신학회논문지,25(6), 792-798.
김태우·이호식.(2019). 국내 하수처리시설에 인공지능기술 적용을 위한 사례 연구. 한국물환경학회지, 35(4), 370-378.
이준석 외. (2019). 「AI 기반 홍수예측알고리즘을 이용한 독립형 홍수예경보시스템 실증화」 실증 기획최종보고서, 한국토코넷·한국건설기술연구원, 과학기술정보통신부.
정성호 외. (2021). 수문 분야에서의 딥러닝 적용 사례, 물과 미래, 한국수자원학회, 54(6), 46-57.
Chaopeng Shen(2018), A Transdisciplinary Review of Deep Learning Research and Its Relevance for Water Resources Scientists, Water Resources Research, 2018. 8558-8593.
Salinas D., Flunkert & Gasthaus(2020),Probabilistic Forecasting with Autoregressive Recurrent Networks, International Journal of Forecasting, 36(3), 1181-1191.
<언론기사>
대한전문건설신문(2020), 광역상수관 파손 위치 인공지능으로 손쉽게 찾는다, 2020.11.12., https://www.koscaj.com/news/articleView.html?idxno=214169.
데이터경제신문(2022), ㈜랩큐, 인공지능 기반 하수처리장 통합 관제 솔루션 개발, 202.204.29., http://www.dataeconomy.co.kr/news/articleView.html?idxno=16248.
물산업신문(2021), 서울시, 전국 최초로 ‘하수관로 결함탐지’에 AI 활용, 2021.06.23., http://www.watermaeil.com/news/articleView.html?idxno=5520.
인공지능신문(2022), 랩큐-한국융합아이티, AI로 기후변화 대비!...수위·수량 예측AI 통해 도심홍수·하수관거 통합관리 시스템 구축한다. 2022.04.27.,
http://www.aitimes.kr/news/articleView.html?idxno=24889.
ZDNet Korea(2020) 아이브랩 “AI로 상수도 수질 관리하고 누수 방지”, 2020.11.03., https://zdnet.co.kr/view/?no=20201103133543.