1. 서 론
1.1 연구의 배경 및 필요성
국가어항은 전통적으로 어업활동의 근거지로서 어선의 안전한 정박, 수산물의 양륙 및 위판, 어업용 기자재 보관 등 생산 지원 기능에 초점을 맞추어 개발되고 관리되어 왔 다. 그러나 사회·경제적 여건의 변화와 국민의 여가 수요 증 대에 따라 현대의 국가어항은 단순한 어업생산 기지를 넘어 해양관광, 레저, 물류, 유통, 지역교류의 거점 등 복합적인 기능을 수행하는 다차원적 공간으로 빠르게 변화하고 있다. 이러한 국가어항의 다기능성은 어항 공간의 가치를 재조명 하고 지역경제에 새로운 활력을 불어넣는 긍정적 측면을 가 지고 있지만, 동시에 다양한 이용 주체 간의 공간 수요 경쟁 을 심화시키고, 이는 무분별한 매립과 과도한 시설 개발로 이어질 위험을 내포하고 있다.
이러한 배경에서, 2019년부터 시행된 「해양공간계획 및 이용에 관한 법률」은 해양공간의 지속가능하고 효율적인 이용을 위해 해양공간적합성 협의 제도를 도입하였다. 이 제도는 어항개발계획을 포함한 각종 해양 이용·개발 계획이 해양공간계획과의 부합성, 해양환경에 미치는 영향, 다른 이 용·개발 활동과의 상충성 등을 종합적으로 검토하도록 요구 한다. 특히, 어항개발계획 심의 과정에서 개발 규모의 적정 성은 핵심적인 검토 항목으로 부상하였다. 해양공간적합성 협의 검토기준 마련 연구(KIOST, 2023)에 따르면 2019년부터 2022년까지의 어항개발계획 관련 적합성 협의 보완 사유 중 규모 적정성 관련 보완 요구가 전체의 23%를 차지하며 가장 높은 비중을 보였다. 이는 현재 어항개발계획 수립 시 적용 되는 수요예측 방식이 어항의 실제 이용현황을 제대로 반영 하지 못하고, 획일적이거나 자의적인 기준에 의존하고 있음 을 시사한다.
따라서, 국가어항의 과도한 개발을 방지하고 해양공간이 라는 한정된 사회적 자원을 최적으로 활용하기 위해서는, 각 어항이 지닌 복합적인 기능과 특성을 과학적으로 분석하 고 이를 바탕으로 미래 수요를 예측하여 적정 개발 규모를 산정할 수 있는 객관적인 방법론과 지원 시스템의 개발이 시급하다. 본 연구의 목적은 국가어항의 다기능성을 고려한 새로운 예측 모델을 구축하고, 이를 해양공간적합성 협의 과정에서 실질적으로 활용할 수 있는 지원 시스템을 구현하 는 데 있다.
1.2 연구의 목적 및 범위
본 연구의 궁극적인 목표는 국가어항의 다기능성을 고려 하여 여러 국가어항들이 공유하는 이용 활동과 어항 면적 간 의 관계를 분석하고, 이를 바탕으로 해양공간적합성 협의 시 개발 규모의 적정성을 검토할 수 있는 지원 시스템을 구축하 는 것이다. 이를 통해 어항 관련 정책 수립 및 개발계획 검토 과정에서 활용할 수 있는 과학적이고 객관적인 판단 근거를 제공하고자 한다. 구체적인 연구 목표는 다음과 같다.
-
새로운 분석 방법론 정립: 국가어항의 다기능적 특성을 반영하여 회귀 기반 군집화와 중복 소속 개념을 결합 한 새로운 모델링 기법 제안
-
전국 국가어항 데이터 기반 실증분석 수행: 전국 115개 국가어항을 대상으로 제안된 방법론을 적용하여 어항 을 기능적 특성에 따라 군집화하고, 각 군집별 예측 회 귀모형 도출
-
개발 규모 적정성 판단 기준 및 지원 시스템 개발: 도 출된 예측 모델을 활용하여 개별 어항의 적정 이용 면 적을 산출하고, 이를 현재 이용 면적 및 계획면적과 비 교하여 개발 규모의 적정성을 판단할 수 있는 정량적 기준과 시각화된 분석 결과를 제공하는 지원 시스템의 프로토타입 구현
본 연구의 공간적 범위는 「어촌·어항법」에 따라 지정된 전국 115개 국가어항 전체를 대상으로 한다. 시간적 범위는 어촌어항관리시스템을 통해 수집 가능한 최신 데이터를 기 준으로 하며, 본 분석에서는 2019년부터 2022년까지 4개년의 데이터를 활용하였다. 국가어항 기초조사의 경우 2024년 발 간 보고서는 어항별 방문객 수와 매출액을 2022년 기준으로 제시하고 있는 반면 2025년 발간 보고서는 2023년 자료를 제 공하지 않고 2024년 수치를 수록하고 있어 2023년까지 포함 하는 5개년 데이터의 확보가 불가능하였으므로 본 연구에서 는 2025년 발간 보고서의 자료를 제외하였다. 내용적 범위는 국가어항의 이용 현황 자료를 바탕으로 개발 규모의 적정성 검토를 지원하는 시스템을 구현하는 것이다.
2. 선행연구 검토
2.1 회귀 기반 군집화(Regression-based Clustering)
회귀 기반 군집화는 클러스터별 선형 회귀(Clusterwise Linear Regression, CLR)로 알려진 방법론으로, 데이터를 유사 한 회귀관계(regression relationship)를 갖는 군집을 형성하고 각 군집에 대해 개별적인 회귀모형을 적합시키는 통계 기법 이다. 이는 전통적인 거리 기반 군집화(예: K-평균 군집화)가 변수 값 자체의 유사성에 초점을 맞추는 것과 달리 변수들 간의 관계의 유사성에 초점을 맞춘다는 점에서 근본적인 차 이가 있다.
예를 들어, 두 어항 A, B가 방문객 수와 이용 면적이라는 두 변수에서 전혀 다른 값을 갖더라도 방문객 수가 1% 증가 할 때 이용 면적이 0.2% 증가한다는 동일한 관계식을 따른 다면 회귀 기반 군집화는 이 두 어항을 같은 군집으로 묶을 수 있다. 이 방법론은 전통적인 거리 기반 군집화로는 포착 하기 어려운 선형관계의 군집 구조를 찾아낼 수 있는 중요 한 장점을 가진다.
본 연구에서도 가장 기본적인 방향은 Späth(1979)의 초기 방법론을 따른다. 그는 데이터셋을 여러 군집으로 분할하고 각 군집마다 선형 회귀식을 적합시켜 군집 내 오차제곱합 (sum of squared errors)을 최소화하는 알고리즘을 제안하였다. 이후 DeSarbo and Cron(1988)은 데이터를 여러 군집으로 분류 하는 동시에 각 군집에 대한 개별적인 선형 회귀 함수를 추 정하는 최대우도방법론을 제안하였고, Qian and Wu(2011)의 정보기반 기준을 이용한 군집 수 결정 방법 등 다수의 후속 연구를 통해 통계적 정교성이 더해지고 방법론이 개선되면 서 마케팅, 경제학, 사회과학 등 다양한 분야에서 지속적으 로 활용되고 있다.
본 연구에서는 국가어항의 이용 면적(종속변수)이 방문객 수, 어선 톤수, 비지정권자 개발 예산 등 다양한 이용 활동 변수(독립변수)에 의해 어떻게 설명되는지에 초점을 맞추었 다. 이에 동일한 개발 및 이용 패턴, 즉 동일한 회귀식이 적 용될 수 있는 국가어항들을 하나의 군집으로 묶고, 각 군집 별로 도출된 회귀식을 전 국가어항 데이터에 적용하는 회귀 기반 군집화 방법론을 채택하여 다음과 같은 현실적합성과 방법론적 이점을 확보하고자 하였다.
현실 반영의 정확성: 국가어항은 실제로 어업, 관광, 물류 등 여러 기능을 복합적으로 수행하므로, 하나의 어항이 관 광성격 군집과 어업성격 군집에 동시에 소속될 수 있도록 허용하는 모델은 이러한 다기능성을 직접적으로 반영하여 현실 설명력을 극대화한다.
과적합 방지 및 모델 안정성 확보: 115개라는 한정된 수의 국가어항을 여러 개의 상호배타적 군집으로 나누면, 일부 군집은 분석에 필요한 최소한의 데이터 수를 확보하지 못할 위험이 있다. 중복 소속을 허용함으로써 각 군집의 분석 대 상 데이터 수를 안정적으로 확보할 수 있으며, 이는 소표본 문제로 인한 과적합을 방지하고 모델의 일반화 성능을 높이 는 데 기여한다.
2.2 중복 소속 군집화(Overlapping Clustering)
중복 소속 군집화는 하나의 데이터 포인트가 동시에 여러 군집에 속할 수 있도록 허용하는 군집 분석 기법이다. 이는 모든 데이터가 단 하나의 군집에만 속해야 한다는 전통적인 배타적 분할 군집화(hard clustering)와 달리, 군집들이 서로 겹쳐질 수 있는 구조를 가진다. 이러한 유연성 덕분에 실제 세계의 복잡한 데이터 구조를 더 잘 반영할 수 있다(Beltrán and Vilariño, 2020).
본 연구에서는 데이터의 소속 여부를 0과 1로 구분하는 이진 포함 방식을 채택하였다. 이는 소속 강도를 확률이나 가중치로 표현하는 퍼지 군집화(Fuzzy Clustering)와도 구별되 는 접근으로, 국가어항 데이터에는 전국 115개소라는 한정 된 표본 안에서 일반적인 특성에서 벗어나는 매우 독특한 물리적·경제적 구조를 가지는 표본들이 일부 존재하므로, 이 러한 어항의 특성을 억지로 분할하는 것보다 확실한 특성을 공유하는 표본들을 군집화하여 분석하는 것이 더욱 적합한 것으로 판단하였다.
중복 소속 군집화의 개념은 마케팅연구에서 체계적으로 고안되었다. Shepard and Arabie(1979)는 ADCLUS(ADditive CLUStering) 모델을 제안하며, 하나의 대상이 여러 잠재 군집 에 동시에 소속될 수 있는 구조를 수리적으로 제시하였다. 이어 Arabie et al.(1981)은 이 틀을 제품 포지셔닝에 적용하면 서, 하나의 제품이 여러 시장 세그먼트(market segments)에 동시에 속할 수 있다는 현실을 보여주었다. 예를 들어, 특 정 자동차 모델은 가족용 세그먼트와 레저용 세그먼트에 동시에 속하는 것이 가능하다. 이후 이 개념은 생물정보학 에서는 유전자 공발현·단백질 상호작용 네트워크에서 겹치 는 모듈을 분석함으로써 단일 유전자(또는 단백질)가 여러 기능적 경로에 동시에 관여할 수 있음을 보이는 연구 (Riccio-Rengifo et al., 2021;Adamcsek et al., 2006), 사회 네트 워크 분석에서는 한 사람이 가족·직장·취미 모임 등 여러 사 회집단에 동시에 소속된다는 전제를 바탕으로 겹치는 커뮤 니티를 탐지하는 연구(Xie et al., 2011;Altunbey and Alatas, 2015) 등으로 확산되었다.
2.3 제약조건이 있는 단계적 선택 회귀분석
다중회귀분석에서 최적의 독립변수 조합을 찾기 위해 널 리 사용되는 기법 중 하나는 단계적 선택(stepwise selection) 방법론이다. 이는 전진 선택(forward selection)과 후진 제거 (backward elimination)를 결합하여 최적의 예측 변수 집합을 탐색하는 방법이다. 전진 선택은 상수항만 있는 모형에서 결 정계수(R²)를 가장 많이 높이는 변수를 순차적으로 추가하고, 후진 제거는 전체 모형에서 시작하여 기여도가 낮은 변수 를 제거해 나가는 방식으로, 이 둘을 결합한 형태가 단계적 선택(stepwise selection) 방법론이다(Hocking, 1976;Montgomery et al., 2012).
본 연구에서는 이러한 단계적 선택 방법론을 적용함에 있 어 회귀계수에 제약을 두는 접근법을 추가로 도입하였다. 회귀분석의 계수에 특정 제약(예: 부호 제약, 크기 제약)을 가하는 방법론은 추정치의 분산을 줄이고 과적합을 방지하 여 모델의 일반화 성능을 높이는 효과가 있는 것으로 알려 져 있다(Meinshausen, 2013;Hofner et al., 2016). 대표적인 예 로, 모든 회귀계수를 양수(+)로 제한하는 비음수 최소제곱 (Non-negative Least Squares, NNLS) 문제는 Lawson and Hanson (1974)에 의해 효율적인 알고리즘이 제시된 이래 널리 사용 되어 왔다.
본 연구에서 회귀계수를 모두 양수로 제한하는 제약을 도 입한 근거는 다음과 같다. 본 연구의 종속변수는 국가어항 의 이용 면적이며, 독립변수들은 방문객 수, 어선 톤수, 개발 사업 예산, 위판장 면적 등 어항 부지를 활용하는 다양한 활 동의 활성화 정도를 나타내는 지표들이다. 이론적으로, 이러 한 개별 활동들이 활발해질수록(즉, 변수값이 커질수록) 필 요한 공간(이용 면적)도 증가할 것이므로, 독립변수와 종속 변수는 양(+)의 상관관계를 가질 것이라는 이론적 가정을 설 정할 수 있다.
이러한 가정을 모델에 명시적으로 반영하여 모든 회귀계 수를 양수로 제약함으로써, 데이터의 노이즈로 인해 발생할 수 있는 비상식적인 부호 뒤집힘(예: 방문객이 늘어날수록 필요한 면적이 줄어든다는 결과)을 방지할 수 있다. 이는 모 델의 해석 가능성을 높이는 동시에, 이론적 타당성을 확보 하는 중요한 과정이다.
3. 연구설계 및 방법론
3.1 데이터 수집 및 전처리
본 연구의 분석 자료는 해양수산부의 어촌어항관리시스템 에서 제공하는 국가어항 기초조사 데이터(MOF, 2020~2025) 에 기반하여 구성되었다. 이 데이터는 전국 115개 국가어항 에 대해 매년 조사되는 다양한 정보를 포괄하며, 본 연구에 서는 어항의 개발현황, 이용현황 등과 관련된 주요 변수들을 선별하여 분석에 활용하였다. 분석에 사용된 주요 변수는 Table 1과 같다.
군집화를 위한 기준 데이터는 2019년부터 2022년까지 4개 년 자료의 평균값을 사용하였으며, 수집된 원자료는 회귀분 석에 적합하도록 전처리 과정을 거쳤다. 어항 관련 데이터 (예: 방문객 수, 사업비, 면적 등)는 소수의 대규모 어항이 존 재하여 분포가 오른쪽으로 길게 꼬리를 갖는 왜도(skewness) 가 큰 분포 특성을 보인다. 이러한 데이터 분포는 회귀계수 의 불안정성을 야기하고 모델의 성능을 저하시킬 수 있다.
따라서 본 연구에서는 로그 변환(log transformation)을 통해 변수 분포의 왜도를 줄이고 정규성에 보다 근접하도록 변 환하여 회귀계수의 안정성을 확보하였다. 또한, 모델링 과정 에서 활용된 변수들 중에는 값이 0인 경우가 존재하므로, log10(0)으로 인해 발생할 수 있는 수치적 오류를 방지하기 위해 모든 값에 1을 더한 후 로그를 취하는 log10(x+1)방식을 적용하였다.
3.2 분석 방법론 설정
3.2.1 회귀 기반 중복 군집화 모델
본 연구의 핵심은 전통적인 거리 기반의 상호배타적 군집 화가 아닌, 회귀 기반의 중복 소속 군집화를 적용한 것이다. 이는 다음과 같은 논리적 근거에 기반한다.
회귀 기반 군집화의 적용: 본 연구의 목적은 단순히 어항 의 외형적 특성(예: 면적, 방문객 수)이 유사한 것들을 묶는 것이 아니라, 어항의 각종 이용 활동이 이용 면적에 미치는 영향 관계가 유사한 어항들을 하나의 군집으로 묶는 것이다. 즉, 동일한 회귀식이 적용될 수 있는 동질적 성격의 국가어 항 군집을 발견하고, 그 군집별 회귀식을 미래 예측에 활용 하고자 하므로 회귀 기반 군집화가 가장 적합한 접근법이다.
중복 소속 군집화의 도입: 국가어항이 어업, 관광, 물류 등 여러 기준에 따라 다양한 정체성을 가질 수 있다는 현실 을 반영하기 위해 중복 소속 가정을 도입하였다. 이는 하나 의 어항이 여러 기능 군집에 동시에 속할 수 있도록 허용함 으로써, 상호배타적 분할 시 나타날 수 있는 소규모 군집 문 제(과적합 위험)를 방지하고, 복수의 모델로 추정한 적정 면 적을 상호 비교함으로써 해석의 폭을 확장하고 예측 결과의 정합성을 제고할 수 있다.
3.2.2 회귀계수 제약을 도입한 단계적 선택 방법론
각 군집별로 최적의 회귀모형을 도출하는 과정에서는 회 귀계수 양수(+) 제약을 도입한 단계적 선택 방법론을 사용하 였다. 이는 어항의 이용 활동(독립변수)이 활발해질수록 필 요한 이용 면적(종속변수)은 증가할 것이라는 이론적 가정 에 근거한다. 이 제약을 통해 데이터의 노이즈로 인한 비상 식적인 음수(-) 계수의 출현을 차단하고, 모델의 해석 가능성 과 안정성을 높이고자 하였다. 구체적인 모델 구축 과정은 다음과 같은 절차를 따른다.
-
상수항만 포함된 초기 모형에서 분석을 시작한다.
-
후보 독립변수를 순차적으로 추가하면서 모든 회귀 계 수가 양수 조건을 만족하고 결정계수가 가장 크게 증가하는 변수를 선택하여 모형에 포함시킨다.
-
변수 추가 이후 다중공선성(VIF > 5)이 확인되는 경우, 통계 적 유의성이 낮은(p-value > 0.05) 변수를 제거하여 모형을 정제한다.
-
더 이상 모형의 결정계수를 유의미하게 개선하는 변수 가 존재하지 않을 때까지 이 과정을 반복한다.
3.2.3 회귀 기반 중복 군집화 모델의 단계적 구성
본 연구에서는 최적의 군집 조합을 찾기 위해, 무작위로 구성한 초기 그룹에서 출발하여 그룹의 확장(expansion)과 축소(reduction)를 반복하는 국소 탐색(local search) 알고리즘 을 적용하였다. 군집의 확장은 경계에 있는 유사 성격의 어항을 군집에 포함시켜 모형의 일반화 가능성을 높이는 시도이며, 축소는 비일관적 이상치(outlier)를 제외하여 회귀 관계의 내적 일관성과 해석력을 높이기 위한 목적으로 수 행된다.
-
확장과정 : 전체 N개의 국가어항 중 현재 군집 G의 크 기가 m일 때, 군집 외부의 각 어항 i에 대해 예비군집 G ∪ {i}를 구성하고, 회귀계수 제약을 도입한 단계적 선택 방법론을 적용한다. 이렇게 얻은 N-m개의 예비군 집 중 결정계수가 가장 높은 후보를 선택하여 신규 군 집으로 갱신한다.(예시 : 115개 어항에서 크기가 50인 군집을 확장할 때 51개 규모의 예비군집 65개가 만들어 지고 이 중 최적의 군집이 선택됨)
-
축소과정 : 전체 N개의 국가어항 중 현재 군집 G의 크 기가 m일 때, 현재 군집의 각 구성원 j를 하나씩 제외 한 예비군집 G - {j}를 만들고, 회귀계수 제약을 도입한 단계적 선택 방법론을 적용한다. 이렇게 얻은 m개의 예 비군집 중 결정계수가 가장 높은 후보를 선택하여 신 규 군집으로 채택한다.(예시 : 115개 어항에서 크기가 50인 군집을 축소할 때 49개 규모의 예비군집 50개가 만들어지고 이 중 결정계수가 가장 높은 예비군집이 기존의 군집을 대체)
-
최종 군집 결정 : 무작위로 구성한 초기 군집에서 확장 과 축소를 반복하여 군집 성격이 더 이상 변하지 않는 안정 상태에 도달한 이후, 사전에 설정한 결정계수(본 연구에서는 R² > 0.8)를 만족하는 최대 크기의 군집들을 최종적으로 선정한다.
본 연구에서 사용한 알고리즘은 Algorithm 1에 의사코드 형태로 정리하였다.
4. 실증 분석 결과
4.1 국가어항 군집화 결과
회귀 기반 중복 군집화 방법론을 전국 115개 국가어항 데 이터에 적용하였다. 랜덤하게 구성한 서로다른 50개의 초기 그룹으로 시작하였으며, 최종적으로 6개의 군집으로 귀결되 었다. 중복 소속을 허용하였기 때문에 하나의 어항이 여러 군집에 동시에 포함될 수 있으며, 각 군집은 유사한 특성을 지닌 어항들의 집합으로 구성되었다. 분석 결과 천성항과 선진포항은 모든 군집에 속하여 다양한 기능적 측면에서 평 균적인 특성을 보이는 것으로 나타났다. 반면, 다대포항이나 구시포항과 같이 어느 군집에도 속하지 않는 어항들은 면적 대비 이용 활동이 타 어항과 비교하여 이례적으로 과다 혹 은 과소한 특성을 보이는 것으로 해석할 수 있다. 전체 115 개 국가어항의 분석 결과는 아래 Table 2와 같다.
4.2 국가어항별 특성 및 적정면적 판단 기준
개별 국가어항의 개발 규모 적정성을 판단하기 위해, 해 당 어항이 속한 모든 군집의 회귀모형으로부터 예측된 이용 면적을 산출하였다. 이때 통계적 객관성을 확보하고자 각 회귀식별 잔차의 표준편차(σ)를 활용하여 ±2σ범위의 신뢰구 간을 설정함으로써, 적정 면적의 상한과 하한을 도출하였다. 이렇게 산출된 수치는 현재의 이용 활동 수준을 감안할 때, 전체 국가어항의 일반적 상관관계에 비추어 해당 어항에 필 요한 면적 범위를 제시하는 정량적 지표로 활용될 수 있다. 회귀식을 활용한 각 어항의 적정면적 분석 결과는 Table 3에 제시하였다.
분석 결과를 종합하여, 국가어항의 면적 적정성을 판단할 수 있는 기준을 Table 4와 같이 설정하고, 각 판단기준에 따 른 대표적 어항의 분석 결과를 시각화하였다.
Table 4의 사례를 통해 구체적인 해석을 살펴보면 다음과 같다. 대포근포항(경남)의 현재 이용 면적(19,422㎡)은 6개 회귀식 모두에서 ±2σ범위의 신뢰구간 하한 이하로 나타나 고 있어 이용활동 수준 대비 어항 공간이 부족할 것임을 시사하므로 어항 공간의 확장을 적극적으로 고려할 필요성 이 제기된다. 반면, 구시포항(전북)은 이와 반대의 경우로 이용 활동에 비해 과다한 면적이 계획 및 개발되었을 가능 성을 보여준다. 이처럼 복수의 군집 모델 결과가 일관된 방 향(과대 또는 과소)을 가리킬 때, 이는 정책적 판단의 의미 있는 근거로 활용될 수 있다.
5. 정책적 활용 방안 및 제언
5.1 분석 결과의 정책적 활용
본 연구에서 개발한 예측 모델과 분석 결과는 국가어항 관련 정책 수립 및 집행 과정, 특히 해양공간 적합성 협의 제도에 다음과 같은 중요한 정책적 함의를 가진다.
본 연구의 가장 직접적인 기여는 어항 개발 계획의 ‘규 모 적정성’을 판단할 객관적이고 과학적인 근거를 제공한 다는 점이다. 기존에는 사업자가 제시하는 수요 예측의 타 당성을 검토할 명확한 기준이 부재하여 검토자의 주관적 판단에 의존하거나 형식적인 검토에 그치는 경우가 많았 다. 본 연구에서 제안하는 시스템은 115개 전체 국가어항의 실제 데이터를 기반으로, 다기능성을 고려한 복수(본 연구 에서는 6개)의 서로 다른 기준(군집 모델)에 따른 적정성 분석 결과를 제시한다. 이를 통해 협의 담당자는 개발대상 국가어항이 타 어항과 비교하여 공간이 부족한 상황인지, 혹은 과잉 개발의 우려가 있는지를 판단할 수 있는 정량적 자료를 제공받을 수 있다. 예를 들어 특정 어장의 현재 이 용 면적이 6개 모델의 관계식으로 산출된 적정면적의 상한 을 초과한다면 과잉 개발 가능성을 시사하는 유의미한 판 단 근거로 활용될 수 있다.
5.2 국가어항 개발 정책 제언
본 연구의 군집화 및 회귀분석 결과는 모든 어항에 획일 적인 기준을 적용하는 것에서 벗어나, 각 어항의 고유한 특 성과 잠재력을 고려한 맞춤형 개발 정책을 수립하는 데 중 요한 기초자료를 제공한다.
본 연구에서 도출된 6개의 군집 모델은 각각 다른 기능 적 특성을 대표한다. 예를 들어, 방문객 변수가 중요하게 작용하는 군집 2 모델의 결과가 유독 높게 나타나는 소래 포구항(인천)은 ‘관광특화형’으로, 레저·관광업 매출액이 중 요한 군집 5 모델의 결과가 두드러지게 높은 원전항(경남) 은 ‘레저연계형’으로 어항의 특성을 부여할 수 있다. 정책 결정자는 특정 어항이 어떤 특성이 강하게 나타나는지를 파악함으로써 해당 어항의 핵심 기능과 발전 잠재력을 진 단하고, 이에 맞는 차별화된 개발 전략을 수립할 수 있다. 예를 들어, ‘관광특화형’ 기준이 높게 나타난 어항에 대해 서는 관광 편의시설 확충과 연계 관광 프로그램 개발을 우 선적으로 지원하고, 외래어선의 이용 활동이 활발한 어항 에 대해서는 추가적인 원인의 분석을 수행하여 정책적 지 원 수요를 파악하는 등의 정책적 활용이 가능하다.
또한, 본 시스템은 현재의 문제 해결을 넘어 미래의 정책 수요를 예측하는 모델로 발전시킬 수 있다. 예를 들어, 특 정 어항이 현재는 이용 면적이 충분하지만, 향후 일부 이용 활동의 급증이 예상된다면, 이를 반영한 모델의 결과물을 활용하여 적절한 정책을 수립하는 것이 가능하다. 이처럼 데이터 기반의 정책 판단기준을 마련하는 것은 사후 대응 을 넘어 선제적이고 예방적인 정책 추진을 통해 국가 자원 의 효율적 배분을 가능하게 할 것으로 기대된다.
6. 연구의 한계 및 향후 과제
본 연구에는 방법론적, 데이터적 측면에서 몇 가지 내재 적 한계가 존재한다. 이러한 한계를 명확히 인지하고 비판 적으로 검토하는 것은 연구 결과의 해석 범위를 명확히 하 고, 향후 연구를 통해 모델을 더욱 정교하게 발전시키기 위 한 필수적인 과정이다. 본 장에서는 연구가 지닌 주요 한계 점들을 상세히 기술하고, 이를 극복하기 위한 구체적인 개 선 방안과 향후 연구 방향을 제시하고자 한다.
6.1 연구의 주요 한계점
본 연구의 한계는 크게 세 가지 범주로 나누어 살펴볼 수 있다. 이는 각각 데이터의 한계, 모델링 과정의 특성, 분 석의 시점에 기인한다.
6.1.1 정량적 데이터 중심 분석의 한계
본 연구는 어촌어항관리시스템에서 제공하는 국가어항 기초조사 데이터를 기반으로 수행되었다. 이는 객관적이고 계량화된 지표를 통해 전국 어항을 일관된 기준으로 비교· 분석할 수 있다는 장점이 있지만, 동시에 어항의 개발과 이 용에 영향을 미치는 다양한 정성적·외부적 요인들을 충분 히 반영하지 못하는 근본적인 한계를 가진다.
-
지형적·물리적 제약 : 어항의 개발 가능 면적은 배후 부 지의 지형, 인근수역의 수심 등 자연적 조건에 따라 크 게 좌우된다. 예를 들어 배후가 산지로 둘러싸여 확장이 물리적으로 어려운 어항과 평지에 위치하여 확장이 용 이한 어항은 동일한 이용 활동이 이루어진다 해도 다른 개발 경로를 가질 수밖에 없다. 현 모델은 이러한 개별 어항의 고유한 물리적 제약 조건을 변수로 포함하지 못 했다.
-
정책 및 제도적 요인 : 해당 지역의 상위 계획에 따라 특정 기능이 전략적으로 강조되는 경우 이는 다른 어항 과는 다른 방식으로 공간의 이용에 영향을 미치게 된 다. 본 연구의 모델은 이러한 정책적 변수를 고려하고 있지 못한 한계가 있다.
이처럼 정량 데이터에 의존한 분석은 어항의 ‘현재 활동 량’에 기반한 평균적 적정 면적을 산출할 수는 있지만 ‘왜’ 그러한 활동이 발생했고, ‘미래에 어떻게 대응할 것인지’에 대한 심층적 인과관계를 설명하는 데에는 부족함이 있다.
6.1.2 모델링 과정에서 연구자의 주관 개입 가능성
본 연구의 군집화 및 회귀분석 과정에는 연구자의 판단 이 일부 개입될 수 있는 여지가 존재한다.
우선, 최종 군집을 선정하는 과정에서 결정계수 기준(R² > 0.8)을 설정하였는데, 이는 다수의 어항이 공유하는 일반적 인 이용 활동–면적 관계를 도출하고 소수의 이상치를 배 제하기 위한 목적에서 설정된 기준이다. 이러한 기준은 연 구 목적상 중대한 문제를 초래하지는 않으나, 통계적·이론 적 근거가 명확히 정립된 기준이라고 보기는 어렵다. 따라 서 동일한 자료를 활용하더라도 기준 설정에 따라 군집의 개수와 구성은 달라질 가능성이 있다.
또한 본 연구의 분석 알고리즘은 무작위로 구성된 초기 군집에서 출발하여 확장과 축소를 반복하는 구조를 가지므 로, 초기값 설정에 따라 최종 결과가 달라질 수 있는 경로 의존성(path dependency)을 내포한다. 비록 본 연구에서는 수 십 개의 서로 다른 초기 군집에서 출발하여 반복 분석을 수행한 결과 6개의 군집이 안정적으로 도출되었으나, 이 외 의 다른 군집 조합 가능성을 완전히 배제할 수는 없다.
이러한 특성은 연구 결과의 재현성과 투명성을 일정 부 분 제한할 수 있으므로, 향후 연구에서는 군집 결정 기준과 초기값 설정에 대한 보다 객관적인 보완 방법론을 모색할 필요가 있다.
6.1.3 정태적 분석의 한계
본 연구는 과거 특정 시점의 정보 간 관계를 분석하는 정태적 모델이다. 이는 과거의 자료를 기반으로 국가어항 의 이용 활동에 따른 평균적 이용 면적을 파악하는 데 초 점을 맞추고 있어, 미래의 변화를 예측하고 선제적으로 대 응하는데는 한계를 보인다.
실제로 어항의 공간 수요는 고정된 값이 아니라 어항 기 능의 변화, 관광 트렌드, 기후변화 등 다양한 요인에 의해 끊임없이 변화하는 동태적 성격을 가진다. 예를 들어, 인근 에 대규모 관광단지가 개발되거나 고속도로의 개통 등 주 변환경의 변화가 발생하는 경우 특정 어항의 공간 수요는 단기간에 급증할 수 있다. 본 모델은 이러한 미래의 잠재적 수요 변화를 반영할 수 있는 구조를 포함하고 있지 않다. 따라서 본 모델은 ‘사후적 진단’에는 유용하지만, 미래지향 적이고 ‘선제적인 계획’을 수립하기 위한 판단의 도구로 활 용되기에는 일정한 한계를 가진다.
6.2 향후 연구 및 발전 방안
앞서 논의된 한계점을 보완하고 분석 모형의 완성도와 정책적 활용성을 제고하기 위해, 본 연구는 다음과 같은 향 후 연구 방향을 제안한다.
6.2.1 정성적 요인을 반영한 혼합 연구방법론 도입
정량적 분석의 한계를 보완하기 위해 정성적 자료의 확 보와 이를 분석 모형에 통합하는 혼합 연구방법론의 도입 이 필요하다. 이러한 접근은 분석 결과의 설명력을 제고하 고, 정책 제언의 현실 적합성을 강화하는 데 기여할 수 있 다.
첫째, 모형 분석 결과 과다 또는 과소 개발로 나타난 대 표적인 어항을 대상으로 심층 사례 분석을 수행할 수 있다. 현장 조사와 지역 주민 및 전문가 인터뷰를 통해 통계 자 료만으로는 포착하기 어려운 개별 어항의 특수한 여건과 차별적 요인을 규명할 수 있을 것이다.
둘째, 지형적 제약, 배후지 특성, 정책적 지원 수준 등 정 성적 요인을 대변할 수 있는 기존 통계 자료(예: 주변 지역 지가 수준)를 발굴하거나, 이를 범주형 변수 또는 더미 변 수로 변환하여 회귀모형에 포함시키는 방안을 검토할 필요 가 있다.
6.2.2 모델 객관성 및 활용성 확보를 위한 기준 마련
정량적 분석의 한계를 보완하기 위해 정성적 자료의 확 보와 이를 분석 모형에 통합하는 혼합 연구방법론의 도입 이 필요하다. 이러한 접근은 분석 결과의 설명력을 제고하 고, 정책 제언의 현실 적합성을 강화하는 데 기여할 수 있 다.
첫째, 모형 분석 결과 과다 또는 과소 개발로 나타난 대 표적인 어항을 대상으로 심층 사례 분석을 수행할 수 있다. 현장 조사와 지역 주민 및 전문가 인터뷰를 통해 통계 자 료만으로는 포착하기 어려운 개별 어항의 특수한 여건과 차별적 요인을 규명할 수 있을 것이다.
둘째, 지형적 제약, 배후지 특성, 정책적 지원 수준 등 정 성적 요인을 대변할 수 있는 기존 통계 자료(예: 주변 지역 지가 수준)를 발굴하거나, 이를 범주형 변수 또는 더미 변 수로 변환하여 회귀모형에 포함시키는 방안을 검토할 필요 가 있다.
6.2.3 동적 예측 모델 결합을 통한 시계열 분석 강화
정태적 분석의 한계를 극복하고 미래 수요를 반영한 정 책 판단 근거를 제공하기 위해, 본 연구의 회귀모형과 시계 열 예측 모형을 결합한 2단계 분석 체계의 구축이 가능하 다.
1단계에서는 방문객 수, 어선 수, 매출액 등 주요 독립변 수에 대해 시나리오 설정과 시계열 모형을 적용하여 미래 이용 활동을 예측한다.
2단계에서는 1단계에서 산출된 예측치를 본 연구에서 제 안한 회귀식에 대입하여, 미래 시점에서 요구될 것으로 예 상되는 적정 이용 면적을 동적으로 산출한다.
이러한 접근은 국가어항 개발 계획 수립 시 현재의 문제 진단을 넘어, 향후 공간 부족 가능성에 선제적으로 대응함 으로써 장기적 관점에서 국가 자원의 효율적 배분에 기여 할 수 있을 것이다.
6.2.4 어항 유형화를 통한 모델 세분화 및 보정
모든 어항을 동일한 기준으로 평가하는 데에는 한계가 있으므로, 어항의 특성에 따라 모형을 세분화하거나 보정 하는 접근 또한 유효하다. 이는 특정 유형의 어항이 구조적 으로 과소 평가되는 문제를 완화하는 데 중요한 역할을 할 수 있다.
이를 위해 회귀분석에 앞서 국가어항을 지정 연도, 주요 기능, 개발 수준, 지리적 위치 등의 기준에 따라 사전 유형 화하고, 유형별로 상이하게 나타나는 데이터 특성을 반영 하여 분석 결과를 보정하거나 정책 활용 시 유의사항을 제 시하는 방안을 검토할 수 있다.
6.2.5 지속가능한 데이터 관리 및 활용 시스템 구축
마지막으로, 본 연구와 같은 데이터 기반 정책 분석이 일 회성에 그치지 않고 지속적으로 수행되기 위해서는 데이터 인프라의 개선이 필수적이다. 현재 PDF 형태로 제공되는 비정형 자료는 분석 가능한 형태로 가공하는 데 많은 시간 과 노력이 요구되며, 이 과정에서 오류 발생 가능성도 존재 한다.
따라서 국가어항 기초조사와 같은 자료는 개방형 API나 스프레드시트 형태로 관리·제공될 필요가 있으며, 이용자 가 데이터 오류를 발견할 경우 이를 피드백하고 수정할 수 있는 체계적인 관리 시스템의 구축이 요구된다. 이러한 환 경이 조성된다면, 본 연구에서 제안한 모형을 정기적으로 업데이트하고 국가어항의 변화를 동적으로 모니터링하는 정책 지원 시스템으로의 확장이 가능할 것이다.
7. 결 론
본 연구는 현대 국가어항의 다기능적 특성을 반영하여, 이용 활동 수준에 따른 적정 이용 면적을 판단할 수 있는 분석 기준을 마련하는 것을 목적으로 수행되었다. 이를 위 해 기존의 단일 유형 분류 방식이 지니는 한계를 지적하고, 회귀 기반 군집화와 중복 소속 군집화 개념을 결합한 새로 운 분석 방법론을 제안하였다. 아울러, 모형의 안정성과 해 석 가능성을 제고하기 위해 회귀계수 양수 제약을 도입한 단계적 선택 방법론을 적용하였다.
전국 115개 국가어항을 대상으로 실증 분석을 수행한 결 과, 6개의 중복 소속 군집과 각 군집별 회귀식을 도출하였 으며, 이를 바탕으로 개별 어항의 적정 이용 면적을 산출하 고 현재 이용 면적과 비교함으로써 개발 규모의 적정성을 판단할 수 있는 기준을 제시하였다. 또한 분석 결과의 정책 적 활용 가능성과 함께, 제안된 분석 체계의 향후 발전 방 향을 논의하였다.
본 연구의 기여는 학술적 측면과 실천적 측면에서 구분 하여 정리할 수 있다. 학술적으로는 국가어항이라는 정책 적 공간 단위를 대상으로 회귀 기반 중복 소속 군집화 기 법을 적용함으로써, 어항의 다기능성을 통계적으로 모델링 하고 해석한 선도적 연구라는 점에서 의의를 가진다. 실천 적 측면에서는 첫째, 해양공간적합성 협의 과정에서 반복 적으로 제기되어 온 개발 규모 적정성 판단 문제에 대해 객관적이고 과학적인 분석 근거를 제시함으로써 정책 결정 의 투명성과 신뢰성을 제고할 수 있다. 둘째, 전국 115개 국 가어항 전체를 대상으로 한 맞춤형 진단과 비교 분석이 가 능하도록 분석 틀을 제시함으로써, 획일적인 개발 정책에 서 벗어나 보다 효율적인 자원 배분과 차별화된 정책 수립 을 지원할 수 있다.
본 연구는 국가어항의 다기능성을 고려한 데이터 기반 정책 지원 체계 구축을 위한 기초적 시도를 제시하였다는 점에서 의의를 가지며, 향후 보다 정교한 방법론과 확장된 데이터 활용을 통해 국가어항 정책과 해양공간 관리 체계 의 발전에 기여할 수 있을 것으로 기대된다.















