1. 서 론
전 세계의 약 70%를 차지하고 있는 해양은 인류에게 무 한한 가능성을 제공하고 있다. 우리나라는 2018년 4월 해양 공간계획 및 관리에 관한 법률을 제정하여 해양공간의 지속 가능한 개발, 이용, 보전 및 안전에 관한 계획을 수립하고 해양을 풍요로운 삶의 터전으로 조성하고자 하였다. 해양공 간은 기본적으로 미래지향적인 관점에서 공공의 수요를 우 선으로 국민의 정책 참여와 건전한 이용 기회를 보장하며 통합적으로 해양용도 구역을 관리하고 있다. 해양용도 구역 은 해양자료를 수집하여 전문가와 비전문가 간에 협의 등을 거쳐 해양의 특성을 분석하고 다양한 의견을 조회하여 지정 한다(MOF, 2018). 하지만 체계적인 해양공간관리 노력에도 매년 해양에서는 다양한 해양사고가 발생하고 있다.
Im and Bang(2014)의 연구에서는 국내에서 발생하는 해양 사고 대부분이 소형선박(어선) 사고이며, 충돌과 기관사고에 의한 사고가 전체 소형선박 사고의 60% 이상으로 분석되었 다. 특히, 매년 약 500건의 국내 충돌사고가 발생하고 있었 으며 공개된 해양안전심판 재결서를 분석하여 대다수가 소 형선박과의 충돌이라는 것을 확인하였다. 또한, Park and Park(2016)의 연구에 따르면 선박의 통항을 감시하며 선박 교통 안전운항 정보를 제공하는 해상교통관제사는 주간보 다 야간에 최초 교신 거리 및 최근접거리가 상대적으로 더 먼 거리에서 교신이 이루어지고 있다고 분석하였다. 이 결 과는 야간이 주간보다 시계가 제한되어 해양사고의 위험성 이 높아지며, 이를 예방하기 위해 선제 조치를 취하고자 하 는 관제사 의식이 반영된 것으로 해석된다. Borovnik(2017)은 선박 업무로 인한 피로는 야간에 증폭되며 야간은 주변 시 야를 어둡게 만들어 바다 상황을 예측하기 어렵다고 하였으 며, 알려지거나 알려지지 않은 위험에 대하여 경계심을 늦 춰서는 안 된다고 지적하였다. 이처럼 항해사의 시야가 제 한되는 야간항해에서는 안전운항을 달성하기 위해 가능한 모든 항해 자료를 수집하고 이를 항해계획에 반영하는 노력 이 필요하다. 야간항해와 관련된 자료를 연구하고 활용하는 일은 알려진 위험뿐만 아니라 잠재적인 위험에도 효과적으 로 대응할 수 있는 기반이 될 것이다.
기존 선박 밀집도에 관한 연구는 선박 위치 데이터를 활 용하여 선박의 주요 위치, 밀도 등을 분석하였다.
Le Tixerant et al.(2018)의 연구에서는 AIS(Automatic Identification System, 이하 AIS) 데이터 처리 및 분석을 통해 해상교통 밀도, 항로 및 항로 흐름, 어업구역 등을 분석하고 예측하였고, Son et al.(2019)의 연구에서는 선박의 항로로 지 정되지 않은 해양 시설물 주변을 통항하는 선박의 AIS 데이 터를 수집하여 통항하는 선박의 분포와 패턴을 길이별로 분 류하여 분석하였다.
Hus et al.(2019)의 연구에서는 VBD 데이터의 특징을 활용 하여 AIS가 없는 선박을 감시하여 선박식별이 가능하다는 것을 확인하였고, Li et al.(2023)은 VBD 데이터를 활용하여 해역 내 작업 중인 야간 어선의 시공간 분포와 변화를 확인 하였다. 이외에도 AIS 데이터 등 개별적인 선박 데이터를 활 용하여 분석한 선행연구가 많았으나 데이터를 종합하여 분 석하는 연구는 사실상 부족한 상황이다.
이에 본 연구는 시야가 제한되고 잠재적 위험이 존재하는 야간 소형선박의 밀도분석을 위해 선박 데이터를 융합하고 분석하여 그 결과를 야간항해에 대한 안전운항 기초자료로 제공하고자 한다.
2. 소형선박 데이터
2.1 소형선박의 기준
국내에서 운항 중인 선박은 감항성 유지와 안전운항을 통 해 국민의 생명과 재산을 보호하는 임무를 수행하고 있으 며, 이는 「선박안전법」제1조에 명시되어 있다. 2009년 「어선법」이 제정됨에 따라 국내 등록 선박은 어선과 일반 선박으로 구분되어 각각 해당 법령에 따라 검사를 받는다. 일반 선박은 「선박안전법」, 어선은 「어선법」에 따라 검 사를 수행하게 되며 선박의 용도에 따라 검사 기준 및 절차 가 다르게 적용된다. 이와 같은 차이로 인해 ‘소형선박’의 정의도 법령마다 다르게 규정되고 있다. 예를 들어, 「선박 법」에서는 총톤수 20톤 미만의 기선·범선 또는 100톤 미만 의 부선을 소형선박으로 간주하고 있으며, 「선박직원법 시 행령」에서는 총톤수 25톤 미만의 선박을 소형선박으로 정 의한다. 「선박안전법」은 선박의 길이를 기준으로 하여 측 정된 전장이 12 m 미만인 선박을 소형선박으로 규정한다. 한 편, 어선의 경우 해양수산부 고시인 「총톤수 10톤 미만 소 형어선의 구조 및 설비기준」에서 총톤수 10톤 미만을 소형 어선으로 정의하고 있다.
국내에서는 소형선박에 대한 정의가 각 법령의 목적과 적 용 대상에 따라 다르며 일관된 기준으로 정립되어 있지 않 다는 것을 확인하였다. 국외 사례를 살펴보면 일본은 총톤 수 20톤 미만을 소형선박으로 정의하고 있으며 우리나라의 「선박법」과 유사한 기준이다(MLIT, 2017). 반면에 영국은 전장이 24 m 미만인 선박을 소형선박으로 정의하고 있다 (MSA, 1995). 이러한 사례들을 통해 국제적으로도 소형선박 의 기준이 국가별로 다르며 각국의 법령 체계와 해양 환경 에 따라 정의되고 있음을 보여주고 있다.
2.2 소형선박의 특징
일반적으로 연안 항해 시 상선 간의 피항 동작은 「국제 해상충돌예방규칙」(COLREG, 1972)에 따라 이루어지며 선 박들은 일정한 침로와 속도를 유지하며 통신을 기반으로 항 해를 한다. 그러나 소형선박의 경우는 AIS 장비가 미설치되 어 있거나 통신이 원활하지 않아 피항 동작이 제대로 이루 어지지 않고 이로 인해 큰 폭의 회피 동작을 수행하게 되는 경우가 많다.
본 연구에서 소형선박의 정의는 연구 결과에 중대한 영 향을 미칠 수 있으므로 연구 목적에 적합한 소형선박 기준 설정이 필수적이다. 국내 소형선박의 특성을 파악하기 위해 한국해양교통안전공단의 통계자료를 참고하였고, 이를 보 완하기 위해 국내 연안에서 야간항해 중 주변 선박에 대한 현장조사를 수행하였다. 현장조사에서는 Fig. 1과 같이 동일 시점의 레이더 화면과 전자해도정보장치(ECDIS, Electronic Chart Display and Information System, 이하 ECDIS)를 비교하여 분석하였다. 그 결과, 상선을 제외한 대부분 소형선박은 ECDIS 상에서 AIS 신호가 수신되지 않는 것으로 확인되었 다. 이러한 현상은 소형선박에 AIS가 설치되지 않았거나, 탐 지거리의 제한 등 복합적인 요인에 기인한 것으로 보인다. 특히, AIS는 연해구역 이상을 항해하는 총톤수 50톤 이상의 예선, 유조선 및 위험물산적운송선에 설치가 의무화되어 있 으며, 대부분 소형선박에는 AIS 대신 「V-Pass 설치 및 운영 에 관한 고시」에 따라 선박패스(V-Pass) 장비가 장착되는 경우가 많아 AIS 데이터로는 소형선박의 밀도분석에 한계가 존재함을 확인하였다.
2023년 9월 4일부터 6일, 그리고 11일부터 15일까지 약 7 일간 서해 연안에서 진행된 야간항해 현장조사 결과, Fig. 2 에서 확인할 수 있듯이 AIS 신호가 수신되지 않는 다수의 소형선박은 강한 조명을 켜고 작업을 수행하고 있었다. 이 들 선박은 소형선박 밀집 해역을 항해하는 동안, 조류에 의 한 위치 변화는 있었으나 엔진을 이용한 적극적인 이동은 거의 나타나지 않았다. 이러한 현장조사를 통해 VBD 데이터 에 기록된 선박 위치 정보가 어업 활동의 변화를 분석하는 데 유용한 자료가 될 수 있음을 확인할 수 있었다.
2.3 소형선박의 분포자료
2.3.1 선박자동식별장치(AIS)
AIS는 특정 범위 내에서 선박 간 정보를 송·수신함으로 써 해상교통의 안전을 도모하고 사고를 예방하는 데 활용 되는 항해보조계기이며, 국제해사기구(International Maritime Organization, 이하 IMO)가 제정한 국제협약인 해상인명안전 협약(International Convention for the Safety of Life at Sea, 이하 SOLAS) 제5장(Safety of Navigation)에 따라 국제항해에 종사 하는 총톤수 300톤 이상의 모든 선박, 국제항해에 종사하지 아니하는 총톤수 500톤 이상의 화물선 및 크기와 관계없이 모든 여객선에 설치를 의무화하고 있다.
한편, 국내에서는 선박설비기준에 따라 AIS 설치 의무 대 상 선박이 다르게 규정되어 있으며, 총톤수 150톤 이상의 여 객선(단, 호소 및 하천 운항 선박과 「유선 및 도선사업법」 에 따른 도선은 제외), 총톤수 300톤 이상이면서 국제항해에 종사하는 선박, 국제항해에 종사하지 않더라도 총톤수 500 톤 이상인 선박 및 연해구역 이상의 해역을 항해하는 총톤 수 50톤 이상의 선박(부선을 제외)에 대해서도 AIS 설치를 의무화하고 있다.
2.3.2 VBD
불빛이 켜진 어선을 탐지할 수 있는 위성 센서는 1970년대 부터 알려졌다. 하지만, 해양에서 어선 불빛의 위치와 밝기 를 계산하는 알고리즘이 없었기 때문에 데이터의 사용은 매 우 제한적이었다. 이를 해결하기 위하여 Elvidge et al.(2015) 는 야간에 불빛이 켜진 어선의 기능을 조사하여 불빛에 의 한 어선탐지 알고리즘을 개발하였다. 불빛은 일종의 스파이 크(Spike)로 간주하며, 이를 자동으로 감지하여 감지 목록을 생성한다. 감지된 목록은 선명도 지수를 기준으로 육상 불 빛 및 가스플레어(Gas Flare) 등 선박 이외의 잡음을 제거한 다. 실제 2014년 인도네시아 해역을 대상으로 수행한 검증 실험에서 전체 어선의 99.3%를 감지하여, 개발된 알고리즘 의 신뢰성과 타당성을 확인하였다. 탐지된 VBD 데이터는 어 선의 활동에 대한 최신 정보를 기관에 제공하여 체계적인 해양공간관리에 도움을 주었고, 제한 구역에서의 불법 어업 활동과 배타적 경제 수역(Exclusive Economic Zone, 이하 EEZ) 경계를 넘어 침입하는 사전 징후를 제공하였다. VBD 데이터 는 동남아시아를 시작으로 현재는 전 세계로 확장되어 제공 되고 있다.
NOAA(National Oceanic and Atmospheric Administration)의 VBD 데이터는 미국 콜로라도주 골든에 위치한 공립대학교 인 Colorado School of Mines 산하의 학술 기관인 Payne 공공 정책연구소 홈페이지(https://payneinstitute.mines.edu)를 통해 제 공되며, 해당 사이트 내 EOG(Earth Observation Group)의 VIIRS 플랫폼에서 직접 받을 수 있다. 단, VBD 데이터의 해당 일 자로부터 45일 이후에 무료로 내려받을 수 있다. VBD 데이 터는 어업 활동뿐만 아니라 어장의 시공간 변화를 분석하는 데 매우 효과적이다(Li et al., 2021). 데이터는 일별 CSV 파일 로 제공되며 월별 및 연별 GeoTIFF 형식의 이미지 파일로도 배포되고 있다. Fig. 3(a)은 1년간(2021년) VBD 데이터를 GeoTIFF 형식의 이미지로 나타낸 것이고, Fig. 3(b)은 2024년 중 12월 기간동안 VBD 데이터를 GeoTIFF 형식의 이미지로 나타낸 것이다. VBD 데이터는 야간에 육상 불빛과 석유 개 발대의 가스플레어 등 선박 이외의 잡음을 제거한 불빛 선 박 데이터로 야간에 불빛이 켜진 어선을 탐지하고 분석하는 본 연구에 바로 적용할 수 있다.
VBD 데이터 수집은 위성이 연구 범위를 통과할 때 표본 시간과 촬영 영역에 따라 달라진다. 우리나라 해역의 VBD 데이터는 표본 시간에 따라 러시아의 수역부터 제주도 남해 안 범위까지 데이터가 제공된다.
2.3.3 소형선박 데이터 융합
국내 선박검사기관인 한국해양교통안전공단에 검사된 어 선 총 척수 중 약 93%가 길이 24 m 미만 어선이었고, 총톤수 10톤 미만 소형선박의 길이는 24 m 미만인 것을 확인하였다 (Jung, 2021). 또한, V-Pass 장치 설명서에 따라 5 kts 이하의 선박이 조업 작업에 종사하고 있다는 것을 확인하였다(Han et al., 2021). 소형선박에 대한 기준조사 및 특징과 관련 선행 연구를 통하여 분석대상 소형선박의 길이는 24 m, 속도는 5 kts, 총톤수는 10톤 미만으로 정하였다. Fig. 4는 소형선박 데 이터의 융합과 연구과정을 도식화하여 나타낸 것이다. 소형 선박 야간 시공간 밀집도 분석을 위하여 분석해역을 선정하 고 AIS 데이터를 1차 전처리하여 소형선박 데이터를 식별하 고 VBD 데이터를 융합하여 소형선박 융합 데이터베이스를 구축한다. 구축된 데이터베이스를 기반으로 데이터 분석을 통해 소형선박의 밀집도 추세를 파악하였다. Fig. 5(a)는 AIS 데이터와 VBD 데이터를 비교한 것이며, 위치정보가 대부분 일치하고 있는 것을 보여주고 있다. Fig. 5(b)는 중복된 선박 위치 데이터를 제외하고 융합된 소형선박 위치데이터를 전 처리하여 시각화하였다. 이러한 과정을 통해 소형선박의 밀 집도 분석의 정확성을 높였다.
3. 소형선박 밀집도 분석
3.1 분석해역 및 범위 선정
이 연구에서는 서남해권 해역 중 분석해역을 목포의 남서 쪽인 흑산도와 진도 사이의 해역으로 설정하였다. 2023년 수 협 연근해조업정보지에 따르면 설정 해역 주변에 비금도, 흑산도, 홍도 등 풍부한 어족자원으로 소형선박의 조업 및 이동이 많은 지역으로 꼽혔기 때문이다. 또한, 통항 분리대 의 설정 및 서해안과 남해안을 왕래하는 선박의 주요 해상 교통 지역인 점을 고려하였다. 선정 범위는 위도 34°N ∼ 34.25°N과 경도 125.5°E ∼ 125.75°E를 연결한 해역으로 Fig. 6 과 같다.
3.2 소형선박 밀집도 분석방법
선박 밀도를 수치화하고 정량적인 평가하기 위하여 해상 교통 분야에 활용되고 있는 밀도분석 방법을 조사하였다.
점 밀도분석 방법은 선박 고유 위치 데이터를 활용하여 일정 시간 동안 지정구역 내 선박 위치 빈도수에 따른 밀도 값을 산출하는 방법이다. 선박의 위치를 직접 사용하여 전 처리 과정이 비교적 간단하고 시간 추이에 따른 선박 위치 수치화로 밀도 계산이 쉽지만, 표류 중인 선박 또는 투묘 중 인 선박과 같이 시간에 따른 위치 변화가 뚜렷하지 않은 선 박과 선박의 속도에 따른 선박 위치 데이터의 차이로 잘못 된 연구 결과가 제공될 수 있다는 한계점이 있다.
통항 빈도수 분석은 선박의 위치를 연결하여 항적을 생성 하고 격자별 통항하는 항적의 빈도수를 계산하여 밀도를 분석하는 방법이다. 같은 선박의 위치를 선으로 연결하기 때문에 점 밀도 분석방법의 한계를 극복할 수 있다는 장점 이 있고 정확한 선박의 척수를 계산할 수 있어 간단한 계산 으로 밀도 값을 구할 수 있다. 하지만 각 격자의 일부만 통 항하여도 밀도 값이 계산되어 격자의 범위에 큰 영향을 받 고 연구 결과의 신뢰도가 떨어질 수 있다는 한계점이 있다 (Kim, 2023).
이 연구에서는 항적 데이터가 아닌 위치 데이터를 기반으 로 선박의 밀집도를 분석하기 때문에 점 밀도분석 방법으로 밀도 값을 계산하되 같은 선박의 이중 계산을 제거하기 위 하여 데이터 전처리 과정에서 중복된 선박을 제거하여 점 밀도분석 방법의 한계점을 개선하였다.
3.3 소형선박 밀집도 분석
우리나라는 사계절이 뚜렷하게 나타나는 국가로 계절에 따라 기상 영향을 받는다. 계절에 따른 수온 변화는 소형선 박의 입출항에도 직접적인 영향을 미치게 된다. 기상에 따 른 계절을 자연계절이라고 부르는데 자연계절은 해당 계절 에 나타나는 특정 기상 영향을 포함한다. 지역마다 사계절 이 시작하는 일자는 다를 수 있지만 사실상 봄은 3월에서 5 월까지, 여름은 6월에서 8월까지, 가을은 9월에서 11월까지, 겨울은 12월에서 2월로 나뉘고 있다(Son and Kim, 2006).
수집한 데이터는 2014년 1월부터 2022년 12월까지이므로 2014년은 사계절 중 봄의 시작 달인 3월부터 통계 분석을 하 였으며, 2022년은 11월 가을 데이터를 마지막으로 적용하였 다. 선정 범위를 분석한 결과, Table 1과 같이 겨울철에는 조 업을 수행하는 소형선박의 수가 다른 계절에 비해 상대적으 로 감소하는 경향을 보였다. 이는 수온이 낮아지는 겨울철 에는 어종의 출현 빈도가 다른 계절에 비해 현저히 감소하 기 때문이다(Ji et al., 2018).
4. 소형선박 밀집도 예측
4.1 소형선박 밀집도 예측방법
4.1.1 순환신경망(RNN)
인공신경망 중 하나인 순환신경망(Recurrent Neural Networks, 이하 RNN)은 각각의 노드 간의 연결을 순환하는 구조로 만 들어 활용하는 Layer 간 연결하고 활용하며 이러한 구조는 은닉층에서 형성한다. RNN은 순차적인 데이터를 처리하는 데 사용되며 입력과 출력의 길이에 따라 다양하게 활용할 수 있다. Fig. 7은 RNN의 일반적인 구조를 보여주고 있다. 간 단하게 식(1)과 같이 나타낼 수 있다. t 시점의 셀 출력값은 ht, t - 1 시점의 셀 출력값은 ht - 1, 입력값은 xt 를 의미한 다. fw는 가중치 w를 파라미터로 평가점수 함수에 활성화 함수로 적용한 것을 의미한다. 식(2)에서 tanh 는 활성화 함 수, Wxh 는 가중치, xt 입력데이터, ht - 1는 이전 단계 은닉 층 출력, Whh 는 가중치를 의미한다. t 단계의 은닉층 출력 ht 는 입력데이터에 가중치를 곱하여 이전 단계 은닉층 출력 에 가중치를 곱한 것을 더하여 활성화 함수를 적용하여 값 을 출력한다. t 시점의 셀 출력값은 식(3)과 같이 가중치 Why와 같이 계산된다. 즉, 과거 데이터를 활용하여 미래 데 이터에 어떤 영향을 미치는지를 학습할 수 있다. 이처럼 순 환신경망은 사진을 설명문장으로 출력하는 이미지 캡셔닝, 문장을 감성 점수로 출력하는 감성분석, 문장을 문장으로 출력하는 기계번역, 영상프레임을 분류결과로 출력하는 프 레임 레벨 상 영상분류 등 다양한 분야에 활용되고 있다.
RNN은 다양한 입력과 출력값에 따라 다양한 분석을 수행 할 수 있다는 장점이 있다. 하지만 RNN의 구조상 시퀸스의 길이에 따라 만들어지는 결과가 달라질 가능성이 매우 크 다. 예를 들어, 1,000개의 입출력값이 존재하는 입력데이터를 사용한다면 끝부분에 있는 h1000는 x999와 h999에 따라 출 력될 것이다. 입력데이터의 주요 패턴이 초기에 나타난다고 가정하였을 때 결과적으로 만들어지는 출력값은 좋지 않을 가능성이 크다.
4.1.2 장단기 기억 신경망(LSTM)
장단기 기억 신경망(Long Short-Term Memory, 이하 LSTM) 모델은 1997년 Hochreiter & Schmidhuber에 의해 제시되었다. RNN과 LSTM의 이용차이점은 셀 상태의 활용 여부이다. Fig. 8은 LSTM의 일반적인 구조를 보여준다. RNN의 구조는 반복적인 체인과 같은 형태를 진행하는 단순한 구조로 되어 있지만, LSTM은 똑같은 체인 구조라도 4개의 특별한 Layer 가 정보 교환하도록 설계되어 있다.
LSTM의 Cell state 상태는 데이터가 장기적으로 의존되는 것을 개선하기 위한 단계이며, 2개의 Gate의 입력을 받아 장 기 의존성을 개선하였다.
셀 상태에 입력되는 ft 값과 it⊙g 값은 Gate를 통해 구해 지며 식(4)와 같이 각 셀 상태의 Ct - 1값에 곱해지고 더해져 계산된다.
계산과정에서 3개의 Layer와 상호작용하게 되는데 이를 각각 ‘삭제 게이트(Forget gate)’, ‘입력 게이트(Input gate)’, ‘출 력 게이트(Output gate)’라고 한다. 우선 삭제 게이트는 식(5) 와 같이 과거 데이터를 삭제하기 위한 게이트를 의미한다. 시그모이드 함수를 활성화 함수로 이용하는 σ는 ht - 1값과 x값을 입력받고 ft 값을 계산하기 위한 가중치 값과 값을 사용한다. 시그모이드의 활성화 함수의 출력값인 결과 값은 [0, 1]의 범위가 한정되며 출력값이 1이 되면 과거 데이터를 기억하도록 설계되며, 반대로 출력값이 0이 되면 과거 정보를 데이터를 삭제하게 된다.
입력 게이트는 식(6) 및 식(7)과 같이 입력되는 정보를 셀 에 기억하는 게이트이다. 입력되는 ht - 1값과 xt값을 가중 치 값과 값을 같이 사용하여 it값을 구하며, xt값 과 ht - 1값을 가중치 값과 값을 같이 사용하여 gt값을 구한다. 여기서 구해진 it값과 gt의 합성곱은 Ct 값 을 구하기 위하여 사용된다. 입력 게이트에 대하여 정리하 면 it는 현재의 정보를 얼마만큼 보낼지를 [0,1]의 범위로 정 의되는 값이며, gt값은 어떤 방향으로 적용할지를 [0,1]의 범 위로 정의되는 값이다.
마지막 게이트인 출력 게이트는 ht을 계산하여 다음 셀로 보내게 된다. 계산을 위해서 식(8)과 같이 입력받은 ot값은 ht - 1값과 xt값을 가중치 값과 값을 함께 이용하 여 계산한다. 그리고 앞서 출력된 삭제 게이트의 값과 입력 게이트의 값을 통하여 계산된 Ct 값을 식(9)와 같이 계산하 여 ht값에도 과거 데이터를 기억할 수 있도록 처리한다.
LSTM은 셀 상태와 3개 게이트를 활용하여 RNN의 단점인 기울기 소실(Vanishing Gradient), 기울기 발산(Exploding Gradient) 문제를 해결할 수 있다(Hochreiter and Schmidhuber, 1997).
최근 인공지능의 등장으로 기계학습(Machine Learning)에 대한 대중의 관심이 점차 증가하고 있다. 해상교통 분야에 서도 기계학습을 통한 연구가 활발하게 이루어지고 있고 새 로운 모델들이 개발되고 있다. 수집된 시계열 데이터는 과 거의 현상을 분석해 줄 수 있으며, 시계열예측 모델을 통하 여 가까운 미래를 예측할 수도 있다. 과거에 축적된 시계열 선박 데이터를 활용하여 미래를 예측함으로써 해양사고를 예방하기 위한 선제 대응이 가능해진 것이다. 이를 위해 앞 서 시계열예측에 대한 개념 및 대표적인 인공신경망 시계열 예측 모델인 RNN 및 LSTM 모델에 대하여 살펴보았다.
본 연구에서는 최근 연구에서 활용도가 높으며 RNN의 단 점인 기울기 소실 및 발산 문제를 해결하기 위하여 고안된 LSTM 모델을 활용하고자 한다(Jang and Kim, 2022). 활용되 는 LSTM 모델은 입력값을 장기간 보존하여 신뢰성 있는 특 정 시점을 예측할 수 있게 한다. 특히, 주기성, 추세, 계절성 과 같은 시간적 패턴을 학습하여 예측 정확도를 향상할 수 있다는 장점이 있다. 이처럼 수집된 장기간 선박 데이터를 기반으로 선박 밀집도를 학습하고 숨겨진 패턴과 추세를 예 측하는데 가장 적합한 LSTM 모델을 최종 선정하였다.
4.2 소형선박 밀집도 예측 결과
소형선박 밀집도 예측에 사용되는 월별 시계열 데이터는 LSTM 모델을 학습시키고 평가하기 위해 훈련 데이터와 검 증 데이터로 구분하였다. 전체 시계열 데이터 중 70%는 학 습 데이터로 사용되었으며, 남은 시계열 데이터 30%는 검증 데이터로 사용되었다. 해당 모델의 예측 성능 향상을 위하 여 LSTM 하이퍼파라미터(Hyperparameter)의 조정이 필요하 며, 이에 따라 은닉 유닛의 개수(NumHiddenUnit)을 조정하여 학습을 진행하였다(Jang and Kim, 2022). 하이퍼파라미터에는 학습률(learning rate), 배치 크기(batch size), 네트워크 구조(레 이어 수 및 노드 수), 활성화 함수, 드롭아웃 비율 등이 있으 며, 본 논문에서는 단순히 노드 수의 변화만 적용한 탐색적 연구로 네트워크 복잡도를 나타내는 은닉 유닛의 개수(노드 수)를 실험 변수로 설정하였다. 은닉 유닛의 개수는 시계열 신경망이 시간 단계 간 정보를 유지할 수 있는 용량과 밀접 하게 관련된다. 그러나 은닉 유닛 수가 과도하게 늘어나면 모델의 파라미터 수가 크게 증가하여 훈련 데이터에 과적 합될 위험이 있으므로 주의가 필요하다. 예측 성능을 평가 하는 방법은 예측값과 실제값의 오차를 지수적으로 반영하 고 모델의 정밀한 예측 능력을 평가하는 평균 제곱근 오차 (Root Mean Squared Error, 이하 RMSE)를 사용하였다. 식(10) 인 RMSE 값은 예측값과 실제값의 차를 제곱하여 평균화하 는 평균 제곱 오차(Mean Squared Error, 이하 MSE)에 단지 루트를 씌운 값으로 식 (11)인 MSE 값이 커짐에 따라 발생 하는 단점을 보완하기 위해 루트를 씌워 계산한 값이다. 일 반적으로 RMSE 값이 0에 가까울수록 좋다고 볼 수 있으나 너무 0에 가까워도 이것은 과적합에 해당한다(Karunasingha, 2022).
Fig. 9는 LSTM 모델의 하이퍼파라미터 조정에 따른 예측 및 검증 결과를 나타낸다. 모델의 예측 성능 향상을 위해 하 이퍼파라미터의 조정이 필요하며, 이에 따라 solver는 adam, Epoch는 500을 설정하되 early stopping을 적용하여 최적의 Epoch가 결정되도록 하였고, 은닉 유닛의 개수를 조정하여 평가를 진행하였다. 다양한 하이퍼파라미터 조정은 많은 시 간과 계산 자원이 필요하다는 한계점이 있어 다양한 하이퍼 파라미터 최적화에 대한 분석은 추후 연구에서 수행할 예정 이다. 해당 연구에서는 은닉 유닛의 개수를 100부터 500까지 50 단위로 조정하였다. 은닉 유닛 수를 중심으로 한 제한적 하이퍼파라미터 조정에 따른 평가를 진행한 결과, RMSE 값 은 초기 은닉 유닛의 개수 100에서 Fig. 9(a)와 같이 RMSE 값 이 93.0으로 나타났으며, 제한적 하이퍼파라미터 조정을 통 해 은닉 유닛의 개수 500에서 Fig. 9(b)와 같이 RMSE 값이 71.6으로 실제값과 가장 유사하게 개선되었다.
5. 결 론
야간 시간대에 발생하는 해양사고는 제한된 시야 상태에 서 인지되지 못한 추가 위험 요소를 파악하지 못해 피해가 확대되는 경향이 있으며, 이러한 이유로 선박 운항자는 주 간보다 야간항해 시 상대적 부담감을 느끼는 것으로 볼 수 있다. 특히, 선행연구를 통해 다수의 해양사고가 소형선박과 관련되어 있음을 확인하였으며 소형선박과 관련된 후속 연 구의 필요성을 파악하였다.
본 연구는 야간이라는 시각적 제약이 존재하는 항해 환경 에서 주요 해양사고 대상인 소형선박을 중심으로 시간 흐름 에 따른 분포 특성을 분석하고, 이를 기반으로 예측하여 선 박의 안전 항해를 지원하고자 하였다.
먼저, 국내를 통항하는 선박의 데이터 수집과 활용사례를 조사한 결과, AIS를 통해 선박 정보를 수집하는 것이 일반적 이며 위성을 활용한 선박 분포 연구도 병행되고 있다는 점 을 확인하였다. 이 과정에서 연구 대상이 되는 소형선박을 정의하고 해당 특성을 파악하기 위해 국내외 기준 및 선행 된 연구를 검토하였다. 이후 분석해역과 범위를 설정하고 소형선박으로 정의된 기준에 부합하는 AIS 데이터를 전처리 하였다. 전처리된 AIS 데이터에 소형선박의 야간 활동을 효 과적으로 탐지하는 VBD 데이터를 융합하여 밀집도 분석의 정확도를 높였다. 이를 통해 확보한 시계열 데이터를 기반 으로 계절별 소형선박 밀집도를 분석하고, LSTM 모델을 활 용해 야간 시간대 소형선박의 밀집도를 예측하였다.
주요 결과는 다음과 같다.
첫째, 사계절이 뚜렷한 우리나라의 계절적 특성이 소형선 박의 활동에도 영향을 미치는 것으로 나타났다. 특히, 겨울 철인 12월부터 2월까지는 소형선박 밀도가 현저히 낮았으 며, 봄부터 가을(3월~11월)까지는 계절별 차이는 있으나 전 반적으로 야간 활동이 꾸준히 이루어지는 것을 확인하였다. 이는 단순한 공간 분석을 넘어 계절성과 시간 흐름을 반영 한 시공간적 예측이 필요하다는 점을 보여준다.
둘째, 공간적 밀도와 시간적 흐름을 반영한 데이터를 기 반으로 LSTM 모델을 학습하고 검증한 결과, 소형선박의 분 포 예측이 가능하다는 점을 확인하였다. 예측 정확도를 높 이기 위해 다양한 하이퍼파라미터 중 은닉 유닛의 수를 조 정하였고, 이를 통해 개선된 학습과 예측이 가능해졌다.
본 연구에서는 AIS 기반 데이터의 한계를 보완하고자, VBD 데이터를 융합하여 활용함으로써 야간 소형선박 밀도 예측의 신뢰성을 향상시켰다. 이 예측 결과는 시야 확보가 어 려운 야간에 외항선박이나 대형선박의 운항자들이 느끼는 심 리적 부담을 줄이는 데 기여할 수 있으며, 해양사고 예방과 안전 항해 지원을 위한 기초 자료로 활용될 수 있을 것이다.
다만, 서남해 해역 중 일부 구역에 한정된 분석 결과를 기 반으로 하고 있으므로 향후 다양한 해역과의 비교 연구가 필요하다. 또한, 학습률, 배치 크기, 드롭아웃 비율 등 여러 하이퍼파라미터를 포함한 최적화 과정을 통해 일반화된 예 측 모델로 확장하고 이를 활용한 해상 교통안전 평가 체계 를 구축하는 것은 향후 연구 과제로 남아 있다.

















