Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1229-3431(Print)
ISSN : 2287-3341(Online)
Journal of the Korean Society of Marine Environment and Safety Vol.30 No.6 pp.541-551
DOI : https://doi.org/10.7837/kosomes.2024.30.6.541

Development of a ConvLSTM-Based Deep Learning Model for Predicting Typhoon Intensity in Climate Change Scenario

Min-Yeong Kim*, Wanhee Cho**
*Researcher, Marine Information Technology Corp., 14, Gasan digital 2-ro, Geumcheon-gu, Seoul, 08592, Korea
**Research Chief, Marine Information Technology Corp., 14, Gasan digital 2-ro, Geumcheon-gu, Seoul, 08592, Korea

* First Author : mmyy333@mitkorea.com, +82-2-2029-7871


Corresponding Author : peacewings@mitkorea.com
September 9, 2024 October 23, 2024 October 28, 2024

Abstract


Climate change has results in increased sea surface temperatures, a northward shift in the highest intensity of typhoons, and an increase in typhoon intensity, and it is expected that future typhoon intensity changes will intensity. In this paper, a deep learning-based model for predicting typhoon intensity was developed to predict the typhoon intensity near the Korea Peninsula that can be caused by climate change scenarios. Historical environmental field data were used as training data to predict the intensity of typhoon according to changes in the future climate change environmental field using climate prediction information. As for the training data, the monthly average meteorological and oceanographic reanalysis data from June to October, which has a high frequency of typhoons from 1980 to 2022, and 241 Best Track typhoons were used as input data. A deep learning model based on Convolutional Long Short-Term Memory (ConvLSTM) was developed to predict typhoon intensity in response to environmental changes by considering both spatial and temporal features of the data. We trained the model to predict the central pressure of typhoons by learning the model with monthly averaged climate data corresponding to each movement path in the typhoon track sequence. The model using input data by setting the range to reflect the spatial characteristics of typhoons, and the best results were shown when a range of 5° × 5°. Through the sensitivity experiments using the Monte Carlo method, Sea Surface Temperature (SST) was confirmed as the variable the most influencing on model prediction.



기후 변화 시나리오 태풍 강도 예측을 위한 ConvLSTM 기반 딥러닝 모델 개발

김민영*, 조완희**
*㈜해양정보기술 연구원
**㈜해양정보기술 연구소장

초록


기후 변화에 의해 해수면 온도 상승, 태풍의 최고 강도 북상, 태풍 강도 증가가 나타나고 있으며, 미래의 태풍 강도 변화가 더 심화될 것으로 예상하고 있다. 본 논문에서는 기후 변화 시나리오에 의해서 발생할 수 있는 한반도 부근의 태풍 강도를 예측하기 위하여 딥러닝 기반 태풍 강도 예측 모델을 개발하였다. 기후 예측정보를 이용하여 미래 기후 변화 환경장 변화에 따른 태풍의 강도를 예측할 수 있도록 과거 환경장을 학습 자료로 사용하였다. 학습자료는 1980년에서 2022년까지의 태풍 발생 빈도가 높은 6~10월의 기상 및 해양 재분석 월평균 자료와 Best Track 태풍 241개를 입력자료로 사용하였다. 환경장 변화에 따른 태풍 강도 예측을 위해 자료의 공간적인 특징과 시간적인 특징을 함께 고려하는 딥러닝 모델인 ConvLSTM 기반으로 모델을 개발하였다. 태풍 트랙 시퀀스의 각 이동 경로에 대한 월평균 환경장 자료를 모델에 학습하여 태풍의 중심 기압을 예측하였다. 태풍의 공간적 특성을 반영할 수 있도록 범위를 설정하여 입력자료로 학습하였으며, 5°⨉ 5°의 범위일 때 가장 좋은 결과를 보였다. 몬테카를로 방법을 이용한 민감도 실험을 통해 모델 예측에 가장 큰 영향을 미치는 변수는 SST로 확인되었다.



    1. 서 론

    태풍(Typhoon)은 북반구 125-160°E에서 주로 발생하는 강력한 열대성 저기압으로, 우리나라에 막대한 피해를 유발하는 자연재해이다. 최근 1991~2020년간 연평균 약 25개 발생 했으며, 낮은 중심기압과 강한 바람 및 집중호우를 동반하여 큰 피해를 유발한다. 태풍이 일으킬 수 있는 극심한 홍수, 파괴적인 바람, 폭풍해일로 인한 해안 침수 등의 현상들로 인해 육지와 해안 부근에서 큰 피해를 입고 있으며(Zheng et al., 2015;Wang and Toumi, 2021;Bhatia et al., 2022), 그에 대한 보다 확실한 대비가 필요한 상황이다.

    매년 발생하는 태풍으로 인한 인명피해 및 재산피해를 예방하고 사회 경제적 영향을 최소화하기 위해 태풍 예측에 관한 연구가 오랜 기간 진행되어 왔다(Xu et al., 2021;Xu et al., 2022). 기후변화에 의한 해수면 온도 상승, 태풍의 최고 강도 북상, 태풍 강도 증가가 나타나고 있으며, 미래의 태풍 강도 변화가 더 커질 것으로 예상한다(Emanuel, 2005;Elsner et al., 2008;Kossin et al., 2014). 태풍의 예측에 관한 딥러닝 모델 연구에 관심도가 높은데, 기존의 통계적 방법에 비해 딥러닝 모델이 입력 자료에서 변수 간의 더 복잡한 관계를 추출하고 정량화할 수 있고, 수치 모델과 달리 일반적으로 더 높은 효율성으로 다양한 형식의 입력 데이터를 처리할 수 있기 때문이다(Gan et al., 2024). 기존의 딥러닝 모델을 활용한 연구는 태풍 트랙의 이동 경로나 발생 빈도에 관한 연구가 많은 편이고(Lian et al., 2020;Sobel et al., 2021;Ren et al., 2022;Dong et al., 2022) 기상 데이터를 고려한 연구도 다수 진행되었으나(Racah et al., 2017;Kumar et al., 2023;Wang et al., 2024) 태풍 강도 예측에 대한 보다 정확하고 현실적인 연구가 여전히 필요하다. 기후변화로 인해 태풍 강도가 강화되는 추세를 보이는 현재 실정에서 매년 강화되는 태풍에 직접적이거나 실질적인 영향을 미치는 요소를 활용해야 한다. 그중에서도 기후변화 시나리오에 의해서 매년 기존의 양상과 다르게 변화하는 환경장의 특징을 고려하는 태풍 강도 예측 연구가 부족한 실정이다.

    본 연구에서는 태풍에 영향을 주는 기상과 대기, 해양 재분석 월평균 환경장과 태풍의 이동 경로를 입력자료로 활용 하고자 한다. 기존의 연구에 따르면 태풍 강도와 밀접한 관련이 있는 상위 3가지 요인에는 해수면 온도(SST), 대기 온도 (TEM), 수직 바람 전단응력(VWS) 등이 있다(Xu et al., 2022). 또한, 기후변화에 관한 정부 간 패널 IPCC(Intergovernmental Panel on Climate Change)에 따르면, 기후변화로 인한 지구 온도의 2℃ 상승은 강한 태풍의 발생 빈도를 높인다는 보고가 있다(Hoegh-Guldberg et al., 2018).

    딥러닝을 이용한 태풍 강도 예측 모델을 구축하기 위해 딥러닝 모델 중 ConvLSTM(Convolution LSTM)을 활용하였고 이 모델은 기존 태풍 시뮬레이션 및 자연재해 분석에 다수 사용되어 왔다(Chen et al., 2019;Tong et al., 2022;Gan et al., 2024). ConvLSTM은 각 단계에서 자료의 공간적인 특징과 시간적인 특징을 함께 고려하는 딥러닝 모델이다. 모델 내의 CNN(Convolution Neural Networks)은 시계열 데이터의 공간 정보를 처리하고, LSTM은 시계열 데이터의 순서 정보를 처리하는 형태로, 시계열 데이터의 공간/순서 정보를 모두 처리할 수 있고 장기 의존성을 학습할 수 있다. 본 연구에서는 태풍의 중심기압을 예측하기 위해 태풍 트랙 시퀀스의 각 이동 경로에 대한 월평균 환경장 자료를 모델에 학습하였다. 이를 바탕으로 강도가 강한 태풍 예측 모델 개발을 목표로 하고 있다.

    본 논문의 2절에서는 학습 자료와 연구 방법, ConvLSTM을 기반으로 한 모델을 설명하고, 3절에서는 모델의 성능 평가와 실험 결과에 대해 논한다. 4절에서는 앞의 결과에 대한 토의 및 결론을 도출하고 향후 연구 발전 방향을 제시한다.

    2. 연구 방법

    2.1 학습 자료

    본 논문에서는 과거 태풍과 관련한 데이터를 입력자료로 사용하여 태풍 중심기압을 예측하는 모델을 개발하고 궁극적으로 기후변화 시나리오의 기후 환경장으로 태풍 강도 예측을 목표로 한다. 기상 및 해양 자료와 태풍 이동 경로를 입력자료로 하여 중심기압을 예측할 수 있도록 훈련하였다. 기상 및 해양 자료는 유럽 중기 예보 센터(the European Centre for Medium-Range Weather Forecasts, ECMWF)의 ERA5 재분석 자료(ECMWF Reanalysis 5 Monthly Averaged Data on from 1940 to present)를 이용하였다. ECMWF는 전 세계의 기상 자료를 수집하고 분석하여 대기, 지표면, 해양의 상태를 재구성하는 기관이다. ERA5는 ECMWF가 제공하는 수치를 바탕으로 최근 기후를 재분석한 자료이며 1940년부터 현재까지의 월평균 기후 정보를 포함하고 있다. 이 자료를 바탕으로 대기, 지표면, 해양의 과거 상태를 추정하여 과거에 대한 정확한 기상정보를 분석하였으며, 그중 1980년~2022년의 월평균 환경장 자료를 입력자료로 사용하였다. ERA5의 해상도는 0.25°이며 태풍 경로에 따라 범위를 벗어나지 않도록 위도 0~60°, 경도 90~180°로 넓은 영역을 설정하여 데이터를 추출하였다.

    입력 변수는 관련 참고 문헌(Sharma et al., 2013;Racah et al., 2017;Xu et al., 2022) 내 등장 빈도수에 따라 Single level은 해수면 온도(SST), Pressure level은 상대습도(RH, 200~850hPa), 절대습도(SH, 200~850hPa), 대기 온도(TEM, 200~850hPa), 바람의 U 성분(U, 200~850hPa), 바람의 V 성분(V, 200~850hPa), 수직 바람 전단응력(VWS, 200~850hPa)을 선정하였다. 변수는 Table 1에서 확인할 수 있다. 입력자료로 사용한 수직 바람 전단응력(Vertical Wind Shear, VWS)은 대기 중 서로 다른 고도에서 바람의 속도와 방향이 변화하는 정도를 나타내는 지표로, 두 개 이상의 고도에서의 바람 속도 벡터의 차이를 계산한다. 여기서는 850, 700, 400hPa와 200hPa에서의 각 U/V Wind 자료를 이용하여 VWS를 계산하였다. 또한, 전체 데이터의 월 평균자료와 입력자료와의 편차를 구한 Anomaly 자료를 생성하여 입력 변수로 활용했다. Anomaly 자료는 이상적인 패턴을 기준으로 예기치 않은 변화를 식별하기 위해 사용된다. Fig. 1은 입력변수 중 참고문헌 등장 빈도수가 높고, 태풍 강도와도 밀접한 관련이 있는 SST를 시각화한 그래프이다. Fig. 1 (c)를 보면 SST가 점차 증가하는 추세를 보이고 있다.

    태풍의 경로는 RSMC(Regional Specialized Meteorological Center, Japan)의 Best Track 데이터를 활용하였다. RSMC는 북 태평양 서부의 열대성 저기압의 분석 및 예측을 담당하는 지역 특별 기상 센터로, 태풍에 대한 분석 및 예보를 포함한 열대성 저기압에 관한 정보를 제공한다(Muroi, 2018). 태풍 최적 경로 추적 데이터인 Best Track은 태풍의 위치, 이동 속도, 중심기압 등을 포함한다. 또 태풍의 발생부터 소멸까지의 기록을 제공하므로 태풍의 특성과 움직임을 이해하고 태풍 경로 및 강도를 추적하는 데 주로 사용된다. 태풍 중 한반도 인근(위도 30~40°, 경도 120~135°)을 지나는 태풍 241개를 선정하였다. 선정된 태풍의 경로를 확인할 수 있는 위도, 경도 데이터를 입력 자료에 추가하고, 해당 경로의 중심기압을 목표 변수로 설정하였다. Fig. 2는 241개 태풍의 최소 중심기압에 대한 개수와 확률밀도함수이다. 태풍 강도가 가장 강한 연도는 2004년으로 평균 951.19hPa의 중심기압을 가지고, 태풍 강도가 가장 강한 달은 2021년 4월로 평균 882hPa의 중심기압을 기록했다.

    모델 입력자료의 수를 증가시키기 위해 데이터를 보간하여 업샘플링(Upsampling) 하였다(Lee et al., 2020a). 태풍의 경로에 따라 3~6시간 간격으로 관측된 데이터를 1시간 간격으로 늘리기 위해 중심기압에 대해 선형 보간법을 수행하였다. 기상 및 해양 환경장 자료는 Best Track 데이터에 대응하는 월평균 데이터를 사용하였다. Table 1 입력 변수의 기압별 태풍 경로 인근 영역을 평균하여 목표 변수인 중심기압과의 상관도를 분석하고, 상관도가 높은 변수를 선정하였다. 실험에 최종적으로 사용된 24개 변수의 목록을 Table 2에 작 성했다.

    2.2 연구 방법

    본 연구에서 환경장 자료를 입력자료로 활용하기 위해서 태풍별 최저기압을 기록한 시점을 기준으로 트랙의 시퀀스를 추출하고, 각 시퀀스의 중심위치를 기준으로 일정한 영역 크기로 설정하였다. 본 연구에서는 학습 영역과 예측 영역을 구분하였다. Fig. 3 (a)의 초록 박스는 학습 영역이고 파란 박스는 예측 영역이다. 파란 박스 영역을 넘은 태풍 트랙을 초록 박스에서 확인할 수 있다. 이는 지정한 영역 내 각 태풍 트랙의 최초 이전 5개 시점을 연장한 후 시각화한 것 이다.

    기후변화에 의한 환경장 변화를 예측할 수 있도록 태풍이 강화되고 최대 강도가 발생되는 대만과 필리핀 인근 해역의 환경장까지 모델을 학습하였다. 학습 영역과 예측 영역을 구분하여 한반도 인근의 환경장이 기후변화에 의해서 변화되는 영향을 고려할 수 있도록 학습을 진행하였다. 이는 우리나라에서 현재까지 발생하지 않았던 강한 강도의 태풍을 예측하기 위한 것이다. Track 데이터의 위도, 경도를 중심으로 하여 동일한 입력 영역 크기로 모든 환경장 변수 자료를 생성하였고, 해양 데이터인 SST의 육지부분이 결측치로 표 시되는 경우는 결측치를 NAN(Not A Number)으로 대체하였다(Fig. 3 (b) 참고). 위도, 경도를 1시간 간격으로 보간하였으므로 환경장 자료 또한 모두 1시간 간격으로 생성되었다. 환경장의 가장 적절한 입력 영역 크기(input area size)를 선택하기 위해 입력 범위에 따른 결과를 비교하는 민감도 실험도 진행하였다. 선정된 태풍별 최저기압을 기록한 시점을 기준으로 트랙의 시퀀스를 추출하고, 각 시퀀스의 중심위치를 기준으로 전후 각각 N개의 인덱스만큼 입력자료를 선택하였다. 해상도가 0.25°이므로 N이 10일 때 입력 영역 크기는 5° × 5°가 되며, N이 30이면 15° × 15°, N이 60이면 30° × 30°의 범위로 데이터를 추출하여 각각 실험하였다. 입력 영역 크기에 대한 민감도 실험 결과를 3.1절에서 설명하였다.

    모델의 입력 변수에 대한 민감도 분석 실험을 진행했다. 민감도 분석(Sensitivity analysis)은 모델 입력 매개변수의 상대적 중요성에 대한 정보를 제공한다. 주로 모델 출력의 불확실성에 대한 모델 입력 그룹의 기여도를 정량화하는 도구로 사용한다(Saltelli et al., 2019). 또한, 모델 내의 프로세스와 그 기반이 되는 자연 시스템을 더 잘 이해하는 데 도움을 줄 수 있고, 입력자료에 대한 예상하지 못한 강한 의존성을 확인하는 도구로 사용될 수 있다(Becker et al., 2011). 민감도 분석의 여러 방법 중, 본 논문의 실험과 같이 딥러닝을 활용한 복잡한 모델과 다양한 변수를 다루는 실험에 적절한 방법으로 알려진 몬테카를로 방법(Monte Carlo method)을 사용하였다. 몬테카를로 방법의 기본 개념은 입력 공간에서 무작위로 실험을 반복한 다음 시뮬레이션 모델을 통해 해당 출력을 계산하는 것이다. 입력 변수에 대한 무작위 변화를 적용하여 모델의 출력에 대한 민감도를 추정하고 다양한 확률 분포에서 샘플링하여 모델의 입력을 변경하고 결과를 관찰한다. 추정한 결과를 토대로 변수 각각의 영향을 따로 계산하고, 이를 여러 번 반복하여 평균을 취합한다. 이 방법은 계산 비용이 낮고, 대규모 데이터에서도 잘 동작하는 간단하고 직관적인 방법으로 많은 실험에 사용되었다(Dao et al., 2020;Golzar et al., 2020).

    본 논문에서 실행한 몬테카를로 민감도 실험은 다음과 같다. 앞서 선정한 태풍 Best Track과 Table 2의 입력 변수들로 실험을 진행하였다. 각 입력 변수의 평균과 표준편차를 활용하여 일정한 분포에서 변화를 생성한다. 실험을 수행하기 위해 변수를 하나씩 선택하여 해당하는 변수의 변화를 적용하고, 하나의 변수에만 변화가 적용된 입력 자료를 이용하여 모델 예측을 실행한다. 이 예측을 입력 변수의 개수만큼 실행하여 변수별 결과를 얻는다. 실제값(전체 변수를 그대로 사용한 결과)과 변수가 수정된 입력자료에 대한 예측값의 차이를 계산하여 각 변수의 민감도를 파악한다. 동일한 실험 과정을 100번 반복했다. 일반적으로 안정적인 통계 분포와 유의성을 확보하기 위한 실험은 100번 이상이면 충분하다(Patra et al., 2022). 이러한 과정을 통해 본 연구의 어떤 입력 변수가 가장 큰 영향을 미치는지 파악하였다. 민감도 실험을 시각적으로 표현한 모식도를 Fig. 4에서 확인할 수 있다.

    태풍의 이동 경로를 반영하기 위해 경도(Lon)와 위도(Lat) 변수를 입력자료에 포함하였으나, 이들 변수는 태풍 선정 과정에서 사용되었기 때문에 민감도 분석에서는 제외되었다. 따라서 민감도 실험의 결과 비교에서 이 변수들은 고려되지 않았다. 민감도 실험에는 경도, 위도를 제외한 22개의 변수가 사용되었다. 입력 변수에 대한 민감도 실험의 결과를 3.1절에서 설명하였다. Fig. 5에서는 연구의 전반적인 흐름을 모식도로 표현하였다.

    2.3 모델 및 평가 방법

    본 연구에서 입력자료로 사용하는 기상 및 해양 자료, 과거 태풍 경로 데이터는 공간적, 연속적인 특성을 보유하고 있다. 기상 및 해양 자료와 목표 변수인 태풍 중심기압의 관계는 비선형적이며 지금과 같이 입력 변수가 많고 복잡한 비선형 관계의 경우 딥러닝을 통해 개선된 학습을 할 수 있다(Cloud et al., 2019;Xu et al., 2021). 이러한 자료의 특성을 모두 고려하여 딥러닝 모델 중 CNN과 LSTM의 결 인 ConvLSTM 모델을 채택하였다. CNN(Convolution Neural Network)은 이미지를 입력하고 합성곱 계층을 통해 데이터 차원감소 등의 과정을 거쳐 주요한 특징을 추출한 후, 그 특징을 기반으로 데이터를 분류하는 분석 모델이다. CNN은 주로 글자, 이미지, 의학영상 처리 및 분류 등의 연구에 주로 이용된다(Kayalibay et al., 2017;Guo et al., 2018). 최근 기상 및 기후 분야에서도 위성 영상과 같은 주요한 패턴을 추정 및 분류하는 연구들이 진행되었다(Ham et al., 2019;Lee et al., 2020b;Wang et al., 2024). LSTM(Long-Short Term Memory)은 순환신경망 RNN(Recurrent Neural Network)의 일종으로, 내부에 순환구조를 포함하며 장기 의존성을 학습하여 시계열 데이터의 공간/순서 정보를 모두 처리할 수 있다. 장기 기억을 손실하기 쉽다는 RNN의 단점을 보완한 모델이며 반복적이고 순차적인 시계열 데이터 학습에 특화되었다(Kumar et al., 2023).

    ConvLSTM은 CNN과 LSTM을 결합한 모델로, 기본적으로 LSTM 셀에 2D Convolution 연산을 결합한 구조이다. LSTM의 순환구조와 함께 각 순환단계에서 입력 데이터에 Convolution 연산을 적용하여 공간적 패턴을 감지하고 기억한다. ConvLSTM은 세 개의 게이트로 구성되어 있는데, 입력 게이트(input gate), 삭제 게이트(forget gate) 및 출력 게이트 (output gate)를 사용하여 현재 입력 및 이전 상태를 기반으로 업데이트한다. LSTM의 장기 기억 방식과 마찬가지로, 셀 상태(cell state)와 은닉 상태(hidden state)를 유지하며 셀 상태는 현재 정보의 핵심 부분을 유지 및 전달하고, 은닉 상태는 현재 출력을 생성한다. Convolution 연산은 입력에 대해 필터를 적용하여 공간적 패턴을 감지하고 특징을 추출하여 학습에 반영한다. ConvLSTM은 태풍의 위치와 강도를 단기적으로 예측하는 데에 수차례 제안되고 사용되었으며(Chen et al., 2019;Gan et al., 2024), 본 연구에서 구축한 ConvLSTM 모델은 Tong et al.(2022)의 모델을 응용하였다.

    ConvLSTM 기반의 본 연구에서는 태풍 트랙 시퀀스의 각 이동 경로에 대한 월평균 환경장 자료를 모델에 학습하여 태풍의 중심기압을 예측하고 그 결과를 토대로 강도가 강한 태풍 예측모델 개발을 목표로 하고 있다. 테스트를 반복하여 정확도와 효율성을 고려한 최적의 모델을 구축했다(Fig. 6. (b) 참고). 모델을 구성하는 layer는 총 9개로, 2D Convolution layer(Conv2D) 8개와 LSTM 1개로 구성하였고 각각의 Conv2D는 64, 128, ⵈ, 1024개의 뉴런으로 구성된다. 신경망의 성능과 훈련에 중요한 역할을 하는 활성화 함수 (Activation Function)는 Mish가 적용되었다(Misra, 2019). 활성화 함수 출력값의 분포가 변화하는 내부 공변량 변화(Internal Covariate Shift) 문제를 줄여주는 배치 정규화(Batch Normalization, BN) 기법도 함께 사용되었다(Ioffe and Szegedy, 2015). pooling에는 2×2 크기의 max-pooling layer가 이용되었 다. max-pooling은 입력 데이터를 작은 영역으로 나누고 그 영역에서 가장 큰 값을 채택하는 방법이다. 데이터의 중요 정보는 유지하면서 계산을 간소화하여 더 효율적으로 모델을 학습할 수 있다. 손실함수를 최소화하기 위한 optimizer로는 Rectified ADAM(Adaptive moment estimation)이 적용되었다. Rectified ADAM는 기존의 ADAM을 수정한 것으로, 학습 초기에 과도하게 큰 분산과 그로 인한 불안정한 학습률을 조정한다(Liu et al., 2020).

    모델의 초기학습률은 0.001로 설정하였으며, CosineDecay- Restarts를 적용하였다. 그로 인해 학습률이 Cosine 형태로 감소하면서 주기적으로 초기값으로 리셋하여 학습률이 너무 낮아지는 것을 방지하고, 모델의 성능을 최적화할 수 있다 (Loshchilov and Hutter, 2017). 입력과 출력 각 자료의 공간 해상도를 일정하게 유지하기 위해 zero-padding을 적용하여 크기를 조정했다. 입력자료를 9(train) : 1(test)로 나누고, train 내 에서 8(training) : 2(validation) 로 다시 나누어 실험을 진행하였다. 최근 발생하는 기후 변화에 따른 태풍의 강도 예측에 모델이 잘 적용되는지 확인하기 위해, train 데이터를 과거에 발생한 태풍으로 구성하고, test 데이터를 최근 태풍으로 설정하였다. validation 데이터는 train 데이터에서 8 : 2 비율로 랜덤 샘플링하였다.

    ConvLSTM 모델의 성능을 평가하기 위해 평균 절대 오차(Mean Absolute Error, MAE), 평균 제곱근 오차(Root Mean Squared Error, RMSE), 상관계수(Correlation Coefficient, CORR)를 평가지표로 사용하였다. 이 지표들은 예측값의 실질적인 편차의 정도를 직관적으로 나타낸다(Lee et al., 2020a).

    MAE = 1 n i = 1 n | y t r u e , i y p r e d , i |
    (1)

    RMSE = 1 n i = 1 n ( y t r u e , i y p r e d , i ) 2
    (2)

    여기서, n 은 데이터 포인트의 개수를 의미하며 ytrue,ij 번째 데이터 포인트의 실제값을, ypred,i 는 해당 데이터 포인트에 대한 모델의 예측값을 나타낸다.

    MAE는 각 데이터 포인트에서 예측값과 실제값 사이의 절대적인 차이를 측정하고, 이를 모든 데이터 포인트에 대해 평균한 값이다. RMSE는 평균 제곱 오차(MSE)의 제곱근으로, 예측값과 실제값 간의 제곱 오차 평균의 제곱근을 나타낸다.

    RMSE는 MSE의 값에 제곱근을 취하므로, 오차의 크기에 대해 더 직관적으로 파악할 수 있고 큰 오차에 가중치를 부여하여 모델의 성능을 잘 평가할 수 있다. 또한, 오차가 낮을 수록 예측 결과가 좋다고 할 수 있다(Mystakidis et al., 2023).

    상관계수(CORR)는 두 변수 간의 선형 관계의 강도와 방향을 나타내는 통계적 지표로, 일반적으로 -1과 1 사이의 범위를 가진다. CORR의 계산식은 다음과 같다:

    CORR = ( y p r e d y p r e d ¯ ) × ( y t r u e y t r u e ¯ ) ( y p r e d y p r e d ¯ ) 2 × ( y t r u e y t r u e ¯ ) 2
    (3)

    여기서, ytrue는 실제 출력값을, ypred 는 모델의 예측값을 나타낸다. 상관계수의 절댓값이 1에 가까울수록 두 변수가 선형 관계가 강함을 의미하고, 0에 가까울수록 선형 관계가 적거나 없음을 의미한다(Sun et al., 2022).

    본 논문에서 MAE는 모델 학습 시 손실(loss) 측정에 사용되어 학습을 최적화하였다. RMSE로는 모델의 정확성을 평가하였으며, CORR은 예측 결과와 실제 관측값 간의 상관관계를 분석하여 모델 성능을 평가하는 데 사용되었다. 이 두 지표를 통해 민감도 실험 및 예측 결과 비교를 수행하고, 모델의 정확성과 신뢰성을 검토하였다.

    3. 결 과

    3.1 민감도 실험 결과

    2.2절에서 설명한 민감도 실험의 결과를 평균하여 변수별 영향의 크기가 큰 순으로 나열했다. 입력 변수별 민감도 실험의 결과는 Fig. 7의 그래프와 같이 나타났다.

    그래프의 최상단에는 SST가 자리하고 있다. 그다음으로는 TEM200(hPa), RH600, SH600, TEM700이 상위 5개 그룹에 포함되었다. 그래프 상 SST의 막대가 다른 변수들에 비해 유독 긴 것으로 보아 해양 변수(Omon)인 해수면 온도(SST)가 예측의 변동에 미치는 영향이 가장 클 것을 예상할 수 있고 이는 태풍 강도를 예측하는 모델의 변수로서 중요한 역할을 한다는 것을 의미한다. 또 대기 온도(TEM)도 SST 다음으로 큰 영향을 미칠 것을 짐작할 수 있고 그다음으로 상대습도 (RH)와 절대습도(SH)가 중요하게 작용할 것으로 판단된다. 앞서 1절 서론과 2.1절 학습자료에서 파악한 결과와 마찬가지로 SST가 가장 중요도가 높은 변수로 확인되었다. Anomaly 변수는 대체로 민감도 실험 결과에서 낮은 순위를 보였다. Anomaly 변수는 앞서 자료 구축 과정에서 변수를 추가했을 때 모델의 성능이 향상되었기에 입력자료에 포함되었다. 민감도 실험의 결과는 모델 정확도에 미치는 영향이 아니라, 예측 결과에 대한 각 변수의 영향을 파악하는 것으로 민감도 실험 결과의 순위가 낮다고 해서 변수에서 제외하진 않았다. 민감도 실험은 변수의 상대적 중요성을 평가한 도구일 뿐이며 민감도 순위가 낮더라도 변수 간의 상호작용 측면에서 중요한 역할을 할 수 있다.

    다음은 입력 영역 크기(input area size)에 대한 민감도 실험 결과이다. Table 3은 N이 10, 30, 60일 때의 영역 크기별 입력 자료를 활용한 예측 결과와 실제 결과와의 CORR, RMSE를 표로 정리한 결과이다. 입력 영역 크기별 실험에서는 5° × 5° (N = 10)일 때 RMSE가 10.63, CORR이 0.83으로 가장 좋은 결과를 보였다. CORR 0.83은 꽤 높은 수치로 두 값 간의 선형 관계가 강하다는 것을 의미한다. RMSE는 낮은 수치는 아니 라고 생각될 수 있으나, 실험의 목표 변수가 태풍의 중심기압(hPa)인 것을 고려하면, 보통 1000hPa에 가까운 값에 비해 그 수치가 낮은 편으로 해석될 수 있다. 이는 입력 영역 크기가 5° × 5°일 때 모델의 정확도가 가장 높을 것이라는 결과를 보여주고 있다.

    3.2 모델 성능 평가 결과

    모델의 성능을 평가하기 위해 실제 관측값과 모델 예측 결과를 비교하였다. 앞의 Table 3에서 가장 좋은 결과를 보인 5° × 5°(N = 10) 크기로 입력 영역을 설정하여 실험을 진행하고 가장 성능이 좋은 모델의 실험 결과를 아래 제시하였다. Fig. 8은 5° × 5° 영역일 때, 태풍 track별 예측 결과(prediction)와 실제 관측값(observation)을 비교한 시계열 그래프이다. 각 그래프의 제목인 ‘9507’, ‘9514’ 등은 각각 1995년에 발생한 7번째와 14번째 태풍을 의미한다. 모든 그래프의 제목은 동일한 방식으로 표기되었다. 그래프 중 9709, 9711, 9719는 상대적으로 태풍강도의 변동 폭이 크고 낮은 중심기압이 관측되었다. 빨간 선인 예측 결과와 비교하면 중심기압의 값이 가장 낮은 관측값에는 못 미치지만 9709와 같이 중심기압이 크게 변동한 트랙의 그래프가 꺾인 양상을 유사하게 나타내었다. 그 외 9507, 9514, 9905는 변동 폭이 작고 상대적으로 높은 중심기압이 관측되었다. 이 트랙의 예측 결과와 관측 결과는 증가-증가 혹은 감소-감소와 같이 서로 비슷한 추정 경향을 보인다. 이러한 결과로 볼 때 본 연구에서 활용한 태풍 중심기압을 예측하는 ConvLSTM 모델이 입력자료의 패턴 또는 특성을 학습하여 예측을 효율적으로 수행하고 있음을 짐작할 수 있다.

    추가로, 본 연구에서 이용한 ConvLSTM 모델의 시간적 효율성을 확인하였다. test 데이터에 대한 예측 소요시간이 트랙 하나당 약 0.4초로 다소 짧은 편인 것이 확인되었다. 실험을 수행하는 PC의 성능 및 데이터의 트랙 수 등에 따라 총 소요시간은 달라질 수 있지만, 태풍 강도 예측에 있어서 정확성과 함께 신속성이 중요하다는 점을 고려할 때, 본 연구에서 제시한 ConvLSTM 모델의 정확성과 신속성 측면에서 모두 높이 평가할 수 있을 것으로 판단된다.

    4. 토의 및 결론

    본 논문에서는 막대한 피해를 유발할 수 있는 자연재해인 태풍에 적절한 대비를 하기 위해 딥러닝을 이용해 태풍의 강도를 예측하는 연구를 수행하였다. 연구를 위해 활용한 모델은 ConvLSTM으로, 입력자료의 공간적, 연속적인 특성을 동시에 처리할 수 있어 선정하였다. ConvLSTM 모델에 한반도 인근을 지나간 태풍의 이동 경로와 대기 및 해양 재분석 자료의 월평균 환경장을 입력 변수로, 태풍 중심기압을 목표 변수로 학습시켰다.

    본 연구의 입력 자료로, 선정된 태풍의 트랙별로 최저기압을 기록한 시점을 기준으로 시퀀스를 추출하고 각 시퀀스의 중심위치를 기준으로 일정한 영역 크기의 환경장 자료를 생성하였다. 기후변화에 의한 환경장 변화를 예측할 수 있도록 모델 학습시 태풍이 강화되고 최대 강도가 발생되는 대만과 필리핀 인근 해역의 환경장까지 학습하였다. 학습 영역과 예측 영역을 구분하여 한반도 인근의 환경장이 기후 변화에 의해서 변화되는 영향을 고려할 수 있도록 학습을 진행하였다. 입력 변수의 중요도를 확인하기 위한 민감도 분석 실험을 진행하였다. 민감도 분석은 몬테카를로 방법을 사용하였고, 실험을 100번 반복한 결과를 비교하였다. 변수의 중요도 결과로는 SST가 예측의 변동에 가장 큰 영향을 미치는 것이 확인되었다. 적절한 입력 영역의 크기를 선택 기 위한 입력 영역 크기별 실험도 진행하였다. 실험 결과는 N = 10(5° × 5°)일 때 가장 좋았고, 민감도 실험을 통해 선택한 입력 영역 크기를 활용하고 모델 최적화 과정을 거치는 실험을 진행하였다. 최종 모델의 평가결과, CORR은 0.83, RMSE는 10.63(hPa)로 확인되었다. 예측 결과와 실제 관측값을 비교한 시계열 그래프를 통해 예측 성능을 시각적으로도 확인하였고, 트랙 하나당 예측 소요시간은 약 0.4초로 모델의 신속성도 검증하였다. 이 연구를 통해 태풍 강도 예측에 ConvLSTM의 적용 가능성을 확인하였고, 향후 연구의 방향을 검토해보았다.

    본 연구에서 월평균 환경장을 입력 자료로 사용하면서 시간적 특성이 다소 둔하게 반영되었다. 하지만, ERA5가 제공한 기후 재분석 자료를 입력자료로 사용한 것과 같이 미래 기후 자료를 활용할 수 있다. 지구의 과거와 현재, 미래 기후변화를 이해하는 기후변화 시나리오 모델 CMIP6(Coupled Model Intercomparision Project 6)에서 미래 기후 정보를 월평균 데이터로 제공하고 있다. ERA5의 월평균 자료로 학습한 모델을 기반으로, CMIP6와 같은 기후변화 시나리오 자료와 미래 가상 태풍 등을 입력자료로 활용하고 기후변화에 적용 가능하도록 추가적인 학습을 강화하는 등의 연구를 진행한다면 미래 발생 가능한 슈퍼 태풍 강도 예측을 기대해볼 수 있을 것이다. 또한, 기존에 존재하는 태풍 강도를 예측하는 수치모델이나 다른 딥러닝 모델과의 비교가 이루어진다면 서로 부족한 부분을 보완할 수 있을 것으로 기대된다. 이러한 태풍 예측 딥러닝 모델을 구현한다면 딥러닝 모델을 이용하여 신속하고 정확한 태풍 예측뿐 아니라 기후 변화에 대비 하는 측면에서 심각한 인적 물적 재난 피해를 줄이고 예방하는 방면에서도 유용하게 활용될 수 있을 것으로 기대된다.

    감사의 글

    이 논문은 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(“극한/복합 자연재해 시뮬레이션 기술 개발”, No. RS-2022-00144325)을 받아 수행된 연구임.

    Figure

    KOSOMES-30-6-541_F1.gif

    The SST / SST anomaly variable from ERA5 data. (a) The SST(Sea Surface Temperature) from ERA5 reanalysis data near the Korean Peninsula on January 1, 1980. (b) SST anomaly data. (c) Trend of SST from 1980 to 2022.

    KOSOMES-30-6-541_F2.gif

    241 typhoons near the Korean Peninsula from the Best Track data. Graph of the count and probability density function of the minimum central pressure of the typhoons.

    KOSOMES-30-6-541_F3.gif

    Visualization of training tracks and input data. (a) A figure that includes all typhoon tracks extending beyond the designated area. The blue box represents the prediction area, the green box represents the training area. (b) The SST environmental field input data.

    KOSOMES-30-6-541_F4.gif

    The diagram of the sensitivity experiments.

    KOSOMES-30-6-541_F5.gif

    The flow diagram of study.

    KOSOMES-30-6-541_F6.gif

    The architecture of data and model.

    KOSOMES-30-6-541_F7.gif

    Results of the sensitivity experiments for the entire period from 1980 to 2022.

    KOSOMES-30-6-541_F8.gif

    Comparison of actual values (black, observation) and predicted values (red, prediction) for typhoon tracks when N=10.

    Table

    Omon (Ocean Monthly Means) / Amon (Atmospheric Monthly Means) data used as input data in ERA5

    24 varibles used as model input data. Variables suffixed with ‘_a` indicate anomaly variables, while those with numbers (200~850) denote the atmospheric pressure levels for omon variables

    RMSE/CORR of ConvLSTM model output for typhoon by input area size

    Reference

    1. Becker, W., J. Rowson, J. E. Oakley, A. Yoxall, G. Manson, and K. Worden ( 2011), Bayesian sensitivity analysis of a model of the aortic valve, Journal of Biomechanics, 44(8), pp. 1499-1506.
    2. Bhatia, K.. A. Baker, W. Yang, G. Vecchi, T. Knutson, H. Murakami, J. Kossin, . Hodges, K. Dixon, B. Bronselaer, and C. Whitlock ( 2022), A potential explanation for the global increase in tropical cyclone rapid intensification, Nat. Commun., 13, 6626.
    3. Chen, R., X. Wang, W. Zhang, X. Zhu, A. Li, and C. Yang ( 2019), A hybrid CNN-LSTM model for typhoon formation forecasting, GeoInformatica, 23, pp. 375-396.
    4. Cloud K. A., B. J. Reich, C. M. Rozoff, S. Alessandrini, W. E. Lewis, and L. D. Monache ( 2019), A feed forward neural network based on model output statistics for short-term hurricane intensity prediction. Wea. Forecasting, 34, pp. 985-997.
    5. Dao, D. V., H. Adeli, H. -B. Ly, L. M. Le, V. M. Le, T. -T. Le, and B. T. Pham ( 2020), A Sensitivity and Robustness Analysis of GPR and ANN for High-Performance Concrete Compressive Strength Prediction Using a Monte Carlo Simulation, Sustainability, 12(3), 830.
    6. Dong, P., J. Lian, H. Yu, J. Pan, Y. Zhang, and G. Chen ( 2022), Weather and Forecasting, 37(6), pp. 971-987.
    7. Elsner, J. B., J. P. Kossin, and T. H. Jagger ( 2008), The increasing intensity of the strongest tropical cyclones, Nature, 455, pp. 92-95.
    8. Emanuel, K. ( 2005), Increasing destructiveness of tropical cyclones over the past 30 years, Nature, 436, pp. 686-688.
    9. Gan, S. L., J. Y. Fu, G. F. Zhao, P. W. Chan, and Y. C. He ( 2024), Short-term prediction of tropical cyclone track and intensity via four mainstream deep learning techniques, Journal of Wind Engineering and Industrial Aerodynamics, 244, 105633.
    10. Golzar, F., D. Nilsson, and V. Martin ( 2020), Forecasting Wastewater Temperature Based on Artificial Neural Network (ANN) Technique and Monte Carlo Sensitivity Analysis, Sustainability, 12(16), 6386.
    11. Guo, Y., J. Cai, B. Jiang, and J. Zheng ( 2018), Cnnbased real-time dense face reconstruction with inverse-rendered photo-realistic face images, IEEE Transactions on Pattern Analysis and Machine Intelligence, 41(6), pp. 1294-1307.
    12. Ham, Y. -G., J. -H. Kim, and J. -J. Luo ( 2019), Deep learning for multi-year ENSO forecasts, Nature, 573 (7775), pp. 568-572.
    13. Hoegh-Guldberg, O., D. Jacob, M. Taylor, M. Bindi, S. Brown, I. Camilloni, A. Diedhiou, R. Djalante, K. L. Ebi, F. Engelbrecht, J. Guiot, Y. Hijioka, S. Mehrotra, A. Payne, S. I. Seneviratne, A. Thomas, R. F. Warren, and G. Zhou ( 2018), Impacts of 1.5°C global warming on natural and human systems, Global warming of 1.5°C An IPCC Special Report, Accessed on Sep. 25, 2020.
    14. Ioffe, S. and C. Szegedy ( 2015), Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, Proceedings of the 32nd International Conference on Machine Learning, 37, 448-456.
    15. Kayalibay, B., G. Jensen, and P. van der Smagt ( 2017), CNNbased segmentation of medical imaging data, arXiv preprint arXiv:1701.03056, Accessed on Sep. 25, 2020.
    16. Kossin, J. P., K. A. Emanuel, and G, A. Vecchi ( 2014), The poleward migration of the location of tropical cyclone maximum intensity, Nature, 509, pp. 349-352.
    17. Kumar, J. S., V. Venkataraman, S. Meganathan, and K. Krithivasan ( 2023), Tropical Cyclone Intensity and Track Prediction in the Bay of Bengal Using LSTM-CSO Method, IEEE Access, 11, 81613-81622.
    18. Lee, J., C. Yoo, J. Im, Y. Shin, and D. Cho ( 2020a), Multi-task Learning Based Tropical Cyclone Intensity Monitoring and Forecasting through Fusion of Geostationary Satellite Data and Numerical Forecasting Model Output, Korean journal of remote sensing, 36(5), pp. 1037-1051 (in Korean).
    19. Lee, J., J. Im, D. -H. Cha, H. Park, and S. Sim ( 2020b), Tropical cyclone intensity estimation using multidimensional convolutional neural networks from geostationary satellite data, Remote Sensing, 12(1), 108.
    20. Lian, J., P. Dong, Y. Zhang, and J. Pan ( 2020), A Novel Deep Learning Approach for Tropical Cyclone Track Prediction Based on Auto-Encoder and Gated Recrrent Unit Networks, Applied Sciences, 10(11), 3965.
    21. Liu, L., H. Jiang, P. He, W. Chen, X. Liu, J. Gao, and J. Han ( 2020), On The Variance Of The Adaptive Learning Rate And Beyond, ICLR 2020, arXiv preprint arXiv:1908.03265.
    22. Loshchilov, I. and F. Hutter ( 2017), Fixing Weight Decay Regularization in Adam, arXiv preprint arXiv:1711.05101, 5.
    23. Misra, D. ( 2019), Mish: A self regularized non-monotonic activation function, arXiv preprint arXiv:1908.08681.
    24. Muroi, C. ( 2018), Brief History and Recent Activities of RSMC Tokyo - Typhoon Centre, Tropical Cyclone Research and Review, 7(1), pp. 57-64.
    25. Mystakidis, A., E. Ntozi, K. Afentoulis, P. Koukaras, P. Gkaidatzis, D. Ioannidis, C. Tjortjis, and D. Tzovaras ( 2023), Energy generation forecasting: elevating performance with machine and deep learning, Computing, 105, 1623-1645.
    26. Patra, M., W. -T. Fan, and C. Kieu ( 2022), Sensitivity of Tropical Cyclone Intensity Variability to Different Stochastic Parameterization Methods, Frontiers in Earth Science, 10, 2022.893781.
    27. Racah, E., C. Beckham, T. Maharaj, S. E. Kahou, Prabhat, and C. Pal ( 2017), Extreme Weather: A large-scale climate dataset for semi-supervised detection, localization, and understanding of extreme weather events, Neural Information Processing Systems, pp. 3405-3416.
    28. Ren, J., N. Xu, and Y. Cui ( 2022), Typhoon Track Prediction Based on Deep Learning, Applied Sciences, 12(16), 8028.
    29. Saltelli, A., K. Aleksankina, W. Becker, P. Fennell, F. Ferretti, N. Holst, S. Li, and Q. Wu ( 2019), Why so many published sensitivity analyses are false: A systematic review of sensitivity analysis practices, Environmental Modeling & Software, 114, pp. 29-39.
    30. Sharma, N., M. M. Ali, J. A. Knaff, and P. Chand ( 2013), A soft-computing cyclone intensity prediction scheme for the Western North Pacific Ocean, Atmospheric Science Letters, 14(3), pp. 187-192.
    31. Sobel, A. H., A. A. Wing, S. J. Camargo, C. M. Particola, G. A. Vecchi, C. -Y. Lee and M. K. Tippett ( 2021), Tropical Cyclone Frequency, Earth’s Future, 9(12).
    32. Sun, J. -P., G. -J. Lv, and X. -G. Ma ( 2022), An improved typhoon simulation method based on Latin hypercube sampling method, Scientific Reports, 12, 9313.
    33. Tong, B., X. Wang, J. Y. Fu, P. W. Chan, and Y. C. He ( 2022), Short-term prediction of the intensity and track of tropical cyclone via ConvLSTM model, Journal of Wind Engineering and Industrial Aerodynamics, 226, 105026.
    34. Wang, C., X. Li, and G. Zheng ( 2024), Tropical cyclone intensity forecasting using model knowledge guided deep learning model, Environmental Research Letters, 19(2).
    35. Wang, S. and R. Toumi ( 2021), Recent migration of tropical cyclones toward coasts. Science 371, pp. 514-517.
    36. Xu, W., K. Balaguru, A. August, N. Lalo, N. Hodas, M. Demaria, and D. Judi ( 2021), Deep Learning Experiments for Tropical Cyclone Intensity Forecasts. Weather and Forecasting, 36(4), pp. 1453-1470.
    37. Xu, X. -Y., M. Shao, P. -L. Chen, and Q. -G. Wang ( 2022), Tropical Cyclone Intensity Prediction Using Deep Convolutional Neural Network. Atmosphere, 13(5), 783.
    38. Zheng, G., J. Yang, A. K. Liu, X. Li, W. G. Pichel, and S. He ( 2015), Comparison of typhoon centers from SAR and IR images and those from best track data sets. IEEE Trans. Geosci. Remote Sens., 54, pp. 1000-1012.