1. 서 론
국내 관광 수요는 지속적으로 증가하고 있으며, 관광지의 특성과 교통, 관광객 인구사회적 특성에 따라 다양하게 나 타나고 있다. 2020년 COVID-19 팬데믹 이후 국내외 관광규 모가 급격하게 감소 이후 회복되고 있는 실정이다. UNWTO 에 의하면 2023년 1분기 국제관광은 2022년 동기간과 비교 하여 2배 이상 증가하여 팬데믹 이전 수준으로 회귀하고 있 다(UNWTO, 2023). 관광수요의 다변화로 인해 관광지에서의 수요에 따른 기반 시설 및 인프라 구축, 컨텐츠 개발이 요구 된다. 연안도시에 대한 명확한 정의는 없지만 육지와 바다 가 접한 지역에 위치한 도시로 정의할 수 있으며, 해수욕, 수변공원, 해안선, 바다낚시 등의 해양관광 활동이 전개되고 있다(Scialabba, 1998 ; Orams and Lueck, 2016). 또한 지역별로 관광 수용 태세가 상이하며, 관광 소비자 측면에서 지역 간 차이가 존재한다. 관광 수요는 경제적 가치를 창출 및 일자 리를 담당하고 있으며, 연안도시의 경우 해양관광을 통한 부 가가치 생산이 높은 비중을 차지하고 있다(Nam et al., 2019).
정부는 관광 수요를 예측하고 이에 따른 정책을 추진하고 있으며, 국가 차원에서 관광산업은 매우 중요한 비중을 차지 하고 있다. 정부는 2022년 제4차 관광개발기본계획을 수립하 여 관광산업 활성화를 위한 사업을 지속 추진하고 있다. 또한 지방자치단체에서도 지역에 특성을 살리고, 관광객 확대를 위 해 노력하고 있다(Ministry of Culture, Sports and Tourism, 2022).
본 연구대상 지역인 부산시의 경우, 국내 대표적인 연안 도시로 인구 규모, 산업적 측면에서 관광산업이 매우 중요 한 역할을 담당하고 있다. 특히 해양활동을 포함한 관광 활 성화를 위해 다양한 사업을 추진하고 있다. 일례로 2019년 부산관광진흥계획, 2021년 부산국제관광도시 육성사업 기본 계획 등을 수립하여 다양한 사업을 추진하고 있다.
본 연구에서는 3가지 Marginal contribution이 있는데 먼저 행위자의 위치기반 데이터를 활용한다는 점이 있다. 행위자 는 관광객수를 의미하며, 기존 국민여행조사 등의 설문조사 를 통한 Top-down 방식에서 빅데이터를 기반으로 관광객수 를 추정하였다. 두 번째는 계절성을 고려한 시계열 분석과 SARIMAX 등 외생변수를 고려한 영향요인을 고려하여 예측 정확도를 향상시켰다. 세번째로 외생변수를 업종별 소비금 액을 통해 관광수요활동을 정량적 데이터로 활용하였다. 특 히 SNS 언급량을 관광활동에 대한 소비자의 정성적 니즈를 정량적 변수로 설정하였다. 마지막으로 분석결과를 토대로 지역특성을 평가하여 시사점을 도출하였다.
관광객수 결정요인과 영향력을 도출하고, 이를 통해 미래 예측 정확도를 향상시키고, 정책 의사결정에 기초자료와 정 책 시뮬레이터 등 의사결정 도구개발에 기여하고자 한다.
2. 선행연구
이 연구와 관련된 선행연구는 크게 관광객 예측 관련 시계 열 분석연구, 관광 영향요인에 관한 연구, 연구 대상 지역인 부산시와 같이 해양관광 관련 연구 등으로 구분할 수 있다.
먼저 방법론 측면에서 시계열 예측 연구로 국내 수원시 관 광객 시계열 자료를 대상으로 이동평균법, 지수평활법을 활 용하여 관광객수를 예측한 연구가 있다(Kim and Park, 2016).
한편 안동 국제축제 방문자를 대상으로 시계열 모형을 활 용하여 절대평균오차비율(MAPE, Mean absolute percentage error)을 기준으로 정확도가 높은 모형을 탐색하여 참여 관광 객수를 예측한 연구가 있다(Jin, 2006). 방한 외국인 관광객수 에 관한 연구로 Lim(2018)은 윈터스의 계절지수평활모형, Seasonal ARIMA 모형을 활용하여 외국인 관광객수를 예측하 였다. 또한 일본인 방한 관광객수를 지수평활법, ARIMA 모 형을 활용하여 예측하였다(Song and Lee, 2006). ARIMA를 활 용하여 경북 영덕지역을 대상으로 유료 관광객, 무료 관광 객, 외국인 관광객, 숙박객 등의 관광객수를 예측한 연구가 있다(Son and Park, 2012). Kim(2023)은 개입 ARIMA 모형을 활 용하여 COVID-19 이후 방한 외국인관광객 수요를 예측하였 고, Hwang(2014)은 Seasonal ARIMA 모형을 활용하여 농촌관 광 수요예측에 관한 연구를 수행하였다.
둘째 관광 영향요인을 고려한 수요예측에 관한 연구로, 포아송모형, 분산분석(ANOVA), 상관관계 등 다양한 방법론 이 수행되었다. 관광비용, 소득, 성별, 연령, 교육연수, 가족 규모, 혼인상태 등의 요인을 독립변수로 설정하여 국내외 관광횟수를 추정한 연구가 있다(Dong and Jung, 2019).
또한 Yun and Lee(2022)은 Bayesian VAR과 ARIMAX 모형 을 활용하여 실내외, 인공자연, 대형소형, COVID-19 등의 요 인에 의한 영향을 추정하였다. 한편 Jee(2009)는 분산분석 (ANOVA), 회귀분석, 요인분석 등의 방법론을 활용하여 관광 정보원천, 관광정보탐색정도, 관광정보 활용정도, 관광정보 등을 요인으로 영향력을 분석하였다. 또한 Gwak(2021)는 이 용교통수단, 동반유형, 정보획득경로, 체류기간, 숙박시설 등 의 요인이 관광만족도에 미치는 영향을 추정하였다.
마지막으로 해양관광 분야의 시계열 분석 연구와 부산 지 역 관광에 관한 선행연구가 있다. Zhang et al.(2022)는 Seasonal ARIMA 모형을 이용하여 울산지역의 고래관광 수요를 예측 하여 유의한 결과를 도출하였다. 한편 Choi et al.(2008)는 해 양크루즈 관광수요 예측방법에 대해 논의하였으며, 여기서 지수평활법과 회귀모형이 크루즈 관광객 예측에는 적합하 지 않다고 주장하였다.
해양관광 영향요인에 관한 선행연구로 Kim et al.(2012)은 부산지역 관광객의 방문동기를 탐색하였으며, 특히 해양관 광 방문동기를 가족화합, 일상탈출, 관광지 문화체럼, 관광 지 경관체험, 해양레저 등 5개의 요인으로 설정하고 유의미 한 영향관계를 도출하였다. Kim and Chung(2010)은 해양관광 지역, 인식, 고객만족, 충성도 등 4개의 요인을 중심으로 해 양 관광지에 대한 재방문에 미치는 영향을 추정하였다. 또 한 Kim(2019)은 해양관광객를 대상으로 체험요인, 체험만족, 행동의도 등에 관한 영향을 탐색하였다. 한편 신안군 섬관 광을 중심으로 스토리텔링, 관광지 매력성, 행동의도 간의 관계를 규명한 연구가 있다(Choi, 2021).
이 연구에서는 앞서 언급한 선행연구의 연구방법을 고려 하였으며, 차이점으로 시계열 예측의 정확도를 향상시키고 자 최근의 외부 이벤트를 고려하였다. 또한 관광 영향요인 을 소비강도와 SNS 언급 유형 트렌드의 빅데이터를 활용하 여 분석하였다. 또한 분석 대상지역에 대한 특성을 고려하 여 유의한 함의를 도출하고자 한다. 정책 의사결정 측면에 서 보다 정확한 정책자료 생산 및 수요예측 기간 적정 개발 규모 추정에 기여하고자 한다.
3. 연구방법
본 연구의 관광수요 예측을 위한 방법론으로 입력 변수와 출력 변수의 관계를 중심으로 확정적 모델(Deterministic model)로써 관광객수와 관광 영향요인을 설정하였다.
본 연구에서는 먼저 기초자치단체별 월간 시계열 데이터를 수집하고, 결측치를 제거하고, 관광 비용, 관광객수, SNS 언급 량 등의 단위 차이가 크기 때문에 전처리 과정을 수행하였다.
먼저 독립변수로 Table 1과 같이 관광객수와 관광소비금 액으로 설정하였다. 관광객수는 한국관광공사에서 제공하는 행위자 기반 데이터로 부산시 내 기초지자체 기준의 외지인 방문자를 관광객수를 설정하였다. 단 외국인 방문자와 행정 동 단위의 거주민 방문자는 제외하였다. 또한 관광소비금액 은 비씨카드, 신한카드의 소비액을 의미하며, 숙박업, 쇼핑 업, 여가서비스업, 식음료업 등의 업종별로 나타냈다. 본 연 구에서는 업종별 소비 규모를 관광객 수요성향을 설정하여 분석하였다.
연구대상으로 2018년 1월부터 2023년 전반기까지 월단위 의 부산 소재 기초자치단체 강서구, 금정구, 기장군, 남구, 동구, 동래구, 부산진구, 북구, 사상구, 사하구, 서구, 수영구, 연제구, 영도구, 중구, 해운대구 등 16개 구군 방문객 데이터 를 활용하였다.
관광객수와 관광소비금액에 영향을 미칠 수 있는 변수로 숙박업, 쇼핑업, 여가서비스업, 식음료업 등 업종별 소비금 액을 설정하였다. 관광객의 SNS(Social Network Service) 언급 량은 잠재 관광객의 수요로 판단될 수 있으며, 본 연구에서는 한국관광공사에 제공하는 지역별 언급량을 통해 국내 관광객 의 잠재된 수요성향을 파악하였다. SNS 언급량은 Instagram, Twitter, Blog, News 등에 노출된 키워드를 의미한다. 데이터 에 대한 자세한 설명은 한국관광데이터랩에 소개되어 있다 (datalab.visitkorea.or.kr). 본 연구에서는 SNS 언급량을 여행유 형을 중심으로 레포츠, 미식, 체험, 휴식, 기타 등의 유형의 트렌드로 구분하여 영향요인으로 설정하였다.
마지막으로 지역특성을 파악하기 위해 지역 내 지역내총 생산(GRDP, Gross Regional Domestic Product)을 활용하였으며, 2021년 기준 문화 및 기타서비스업의 총생산가치를 활용하 였다. 2022년의 부산시 기초자치단체 내에서 생산된 문화 및 기타서비스업 부문의 최종재화와 서비스의 시장가격 합을 의미한다(Statistics Korea, 2022),). 또한 부산시청에서 매년 조 사하고 있는 해양산업조사의 해양관광 분야 종사자를 이용 하였다(Busan Metropolitan City Hall, 2022). 해양관광 분야는 해양레저 스포츠업, 숙박 및 음식업 등의 사업체를 의미한다.
관광객수 예측은 관광수요를 의미하며, 관광객수 예측은 정부의 관광정책 및 사업 시행 측면에서 매우 중요한 자료이 다. 특히 정확한 관광객수 예측은 기초 인프라, 관광프로그 램, 관광공급 등의 결정에 매우 중요한 의사결정 요소이다 (Hwang, 2014). 관광수요의 시계열 예측에는 추세(Trend), 계절 성(Seasonality), 주기(Cycle) 등의 시계열 패턴이 존재한다.
본 연구에서 수행한 시계열 모형 중 계절성을 고려하지 않은 방법인 단일이동평균법(SMA, Simple moving average)은 월별 시계열 데이터를 연속적으로 산술평균하여 관광객수 과 관광소비금액을 예측하는 방법이다. 단일지수평활법(SES, Single exponential smoothing)과 이중지수평활법(DES, Double exponential smoothing)은 최근 Data에서 더 많은 가중치를 부 여함으로써 가중평균 평활법의 일종이다(Korea Culture and Tourism Institute, 2007).
다음 시계열 데이터의 계절성을 고려한 모형으로 감쇠 추 세 계절 가법, 감쇠 추세 계절 승법, 계절 가법, 계절 승법, Holt-Winters' 가법, Holt-Winters' 승법 등이 있다. 계절변동을 가법모형(Additive model) 또는 승법모형(Multiplicative model) 을 의미한다.
ARIMA(Autoregressive Integrated Moving Average) 모형은 대 표적인 Box-Jenkins 방법 중 하나로 AR(자기회귀모형 차수), I(차분정도), MA(이동평균모형 차수) 등 3개의 부분으로 구 성되어 있다(Ho and Xie, 1998;Box et al., 1994).
SARIMA(Seasonal-ARIMA) 모형은 계절성 ARIMA를 의미하 며, 기존 ARIMA 모형에 계절성과 주기성이 추가된 모델이 다. 즉 기존 ARIMA 모델 단점인 계절성을 반영 못하는 단점 을 보완한 모형으로 계절성 자기회귀 누적이동평균 모형을 의미한다.
ARIMAX(ARIMA with exogenous inputs model)은 외생 변수 를 고려한 ARIMA 모형으로 외부적 영향을 고려한 공변량 자기회귀누적이동평균을 의미한다. ARIMAX 모형은 다양한 외적 변수의 조건을 고려하여 종속변수(본 연구에서는 관광 객수와 관광소비금액을 의미)와 동적 관련성을 반영함으로 써 모형을 개선할 수 있는 장점이 있다고 알려져 있다(Box et al., 1994).
본 연구는 단순 시계열 모형을 활용하여 관광객수와 관광 소비금액의 정확도 높은 모형을 탐색하고, 다변량 시계열 모형을 통해 관광규모에 영향을 미치는 요인을 추정하고자 한다.
4. 실증분석 결과
4.1 기술통계 및 단위근 검정 결과
부산 시내 기초자치단체별 관광객수, 관광소비금액, 영향요 인 등 파라미터의 평균(Mean), 표준편차(SD, Standard Deviation), 변동계수(CV, Coefficient of Variation) 등을 Table 2에 나타내 었다. 변동계수는 표준편차(σ)를 표본 평균이나 모평균 등 산술 평균(μ)으로 나눈 것이다. 즉 변동계수는 표준편차를 평균으로 표준화(Standardization)한 계수로 평균을 1로 만들 어 상대적인 변동(산포도)을 비교할 수 있다. 분석결과 지역 에 따른 관광객수, 관광소비금액, SNS 언급 트렌드 등의 차 이 존재하였다.
평균 관광객수의 경우, 부산진구 5.61백만명, 해운대구 5.27백만명, 기장군 3.14백만명, 중구 3.08백만명 등의 순으로 나타났으며, 이는 부산진구는 서면 등 인구유입이 많고, 해 운대구와 기장군은 해수욕장 등 연안관광 수요가 많은 것으 로 판단된다. 숙박관광객수의 경우, 해운대구0.54백만명, 부 산진구 0.36백만명, 수영구 0.21백만명 등의 순으로 해운대구 관광객의 1박 이상의 숙박수요가 가장 높은 것으로 분석되 었다.
평균 관광소비금액의 경우, 해운대구 42.64십억원, 부산진 구 33.92십억원, 기장군 27.22십억원 등의 순으로 관광객수와 유사한 경향을 보였다. 따라서 관광객수와 관광소비금액은 상관관계가 높은 것으로 판단된다. 관광소비금액을 업종별 로 구분하여 비교한 결과, 쇼핑업 소비금액은 해운대가 가 장 많았으며, 레저서비스업 소비금액은 기장군, 요식업종 소 비는 부산진구에서 가장 소비가 많았다. 따라서 지역에 따 른 관광객의 소비성향이 차이가 존재하였다.
평균 전체 SNS 언급량을 보면 해운대가 14.70천건으로 가 장 많았으며, 다음 수영구 55.22천건, 기장군 42.80천건, 부산 진구 36.94천건 등의 순으로 SNS 언급 강도가 관광객수 및 관광소비금액와 관계가 있음을 의미한다.
SNS 분야별 언급건수로 먼저 평균 레저 스포츠 관련 SNS 언급량을 보면 해운대구 5.66천건, 수영구 4.12천건, 기장군 2.66천건, 부산진구 1.47천건 등의 순으로 레저 스포츠에 대 한 잠재 관광객의 관심도가 나타났다. 미식 관련 SNS 언급 건수도 레저 스포츠 관심도와 유사하나, 동래구 영도구가 상위에 위치하여 차이가 존재한다. 체험 관련 SNS 언급건수 의 경우, 최상위 지역으로 해운대구, 수영구, 기장군, 영도구, 중구 순으로 조사되었으며, 휴식 관련 언급량도 유사하게 나타났다. 따라서 SNS 언급량을 통해 잠재 관광객의 관심도 를 종합하면 해운대, 수영구, 기장군 등 바다가 근접한 지역 에서 높은 관심을 보였다.
변동계수를 비교하면, 관광객수의 경우 금정구(0.3840), 동 구(0.1503), 사상구(0.1407), 영도구(0.1406) 등의 순으로 변동 폭이 크게 나타났다. 숙박관광객수의 경우, 금정구(0.1989), 영도구(0.1899), 해운대구(0.1869), 중구(0.1832) 등이 상대적으 로 높은 편이다. 관광소비금액의 변동계수를 비교한 결과 북구(0.3350), 금정구(0.2667), 강서구(0.2430), 중구(0.2142), 쇼 핑업 소비금액의 경우, 금정구(0.4850), 북구(0.3873), 서구 (0.2470), 동구(0.2339), 숙박업 소비금액의 경우, 중구(0.3476), 동래구(0.3195), 수영구(0.3123), 영도구(0.3038) 등의 순으로 분석되었다.
이는 관광수요 측면에서 지역 간 또는 지역 내에서 수용 력에 영향을 미칠 수 있다. 즉 관광수요의 변동은 관광수용 규모 및 활동유형 공급측면에서 한계가 존재함을 의미하며, 관광규모의 가변성을 고려한 수용태세를 갖출 필요가 있다.
한편 불안정한 시계열 자료를 분석 시, 가성회귀 또는 허 구적 회귀현상으로 분석결과에 대한 신뢰도가 저감된다. 본 연구에서는 관광객수 및 관광소비금액의 시계열 데이터이 므로, ADF(Augmented Dickey-Fuller) 단위근 검정방법을 수행 하여 데이터의 안정성을 판단하였다(Bae and Yu, 2018).
본 연구의 지역별 단위근 분석결과, 관광객수의 경우, Table 3과 같이 유의확률 0.05를 기준으로 강서구, 기장군, 남 구, 동래구, 부산진구, 북구, 사하구, 서구, 수영구, 연제구, 영도구, 중구, 해운대구 등이 단위근이 존재하지 않아 안정 적인 시계열 자료로 확인되었다. 반면 금정구, 동구, 사상구 등 일부 지역에서 단위근이 존재하여 불안정적인 시계열 자 료로 나타났다.
4.2 단변량 시계열 분석 결과
4.2.1 COVID-19 미고려 시계열 분석결과
시계열 예측에 대한 평가는 사후평가와 사전평가로 구분 되며, 본 연구에서는 사후평가를 통해 예측에 대한 정확성 을 평가하였다. 예측결과에 대한 평가 즉 정확성은 오차 크 기를 기준 평가하며, 평가방법으로 오차제곱합(SSE, Sum of Squared Error), 오차제곱평균(MSE, Mean Squared Error), 평균 오차제곱근(RMSE, Root Mean Squared Error), 평균오차제곱근 비율(RMSPE, Root Mean Squared Percentage Error), 절대평균오 차비율(MAPE, Mean Absolute Percentage Error) 등이 있다.
앞서 언급한 바와 같이 시계열 예측의 정확성은 예측오차 에 의해 결정되며, 오차가 작을수록 정확성은 증가한다. 본 연 구에서는 선행연구에서 주로 활용되고 있는 평균오차제곱근 (RMSE)을 기준으로 정확성을 평가하였다(Kim and Park, 2016).
COVID-19를 이벤트로 고려하지 않은 관광객수 및 관광 소비금액 시계열 모형 분석결과를 Table 4에 나타내었다. 여기서 감쇠 추세 계절 가법(DTAS, Damped Trend Additive Seasonal), 감쇠 추세 계절 승법(DTMS, Damped Trend Multiplicative Seasonal), 계절 가법(SA, Seasonal Additive), 계절 승법(SM, Seasonal multiplicative) 등이다.
또한 홀트-윈터의 가법(HWA, Holt-Winters' Additive), 홀트- 윈터의 승법(HWM, Holt-Winters' Multiplicative), 감쇠 추세 비 계절(DTS, Damped Trend Additive Nonseasonal), 단일 이동 평 균(SMA, Simple Moving Average), 단일 지수 평활(SES, Single Exponential Smoothing), 이중 이동 평균(DMA, Double Moving Average), 이중 지수 평활(DES, Double Exponential Smoothing) 등을 의미한다.
COVID-19를 이벤트로 고려하지 않고 관광객수에 대한 시 계열 분석결과 대부분의 지역에서 SARIMA 모형이 가장 높 은 정확성을 보였다. 다만 남구의 경우 감쇠 추세 계절 가법 (0.18)이 SARIMA 모형(0.19)보다 정확한 예측모형으로 나타 났다.
지역별로 보면 서구의 예측모형의 RMSE가 가장 낮은 0.0859이며, 다음 영도구 0.0966, 북구 0.1292, 사하구 0.1320, 연제구 0.1398 등의 순으로 나타나 이들 지역에서는 예측의 정확도가 높게 나타나, 관광객수 예측 측면에서 적합한 모 형으로 분석되었다. 반면 부산진구 0.4487, 해운대구 0.3318, 중구 0.2288 등의 순으로 RMSE가 매우 높아 정확도 측면에 서 단순 시계열 모형이 관광객수를 예측하는데 있어 한계가 존재하였다. 특히 부산진구와 해운대구의 경우 관광객 강도 가 높은 지역으로 외부 영향요인을 탐색할 필요가 있다고 판단된다.
관광소비금액 시계열 모형 분석결과, 대부분의 지역에서 앞서 관광객수 분석결과와 유사하게 SARIMA 모형이 가장 높은 정확성을 보였다.
지역별로 보면 영도구 지역의 예측모형의 RMSE가 가장 낮은 0.0231이며, 다음 서구 0.0326, 사하구 0.0538, 동구 0.0548, 남구 0.0637 등의 순으로 나타나 이들 지역에서는 예 측의 정확도가 높게 나타나, 관광소비금액 예측 측면에서 SARIMA 모형이 최적의 모형으로 분석되었다. 반면 해운대 구 0.4014, 부산진구 0.3065, 기장군 0.2709, 중구 0.1687 등의 순으로 RMSE가 매우 높아 정확도 측면에서 단순 시계열 모 형이 관광객수를 예측하는데 있어 한계가 존재하였다. 따라 서 COVID-19 팬데믹을 고려하여 시기를 구분하여, 사회적 인 이동 제약의 영향을 탐색할 필요가 있다고 판단된다.
4.2.2 COVID-19 고려한 시계열 분석결과
COVID-19를 이벤트로 고려하여 관광객수 및 관광소비금 액 시계열 모형 분석결과, Table 5와 Fig. 1과 같이 앞서 분석 한 COVI19를 고려하지 않은 모형과 정확도 측면에서 상당 한 차이를 보였다. COVI19를 고려하지 않은 관광객수 예측 모형에서는 대부분 지역에서 SARIMA 모형이 가장 높은 정 확성을 보인 반면, 이중이동평균법과 SRIMA 모형이 주를 이 뤘다. 특히 정확도 측면에서 상대적으로 높은 수치를 보였 으며, 최적 모형도 상이하였다. 최적 모형으로 이중이동평균 법이 최적 모형으로 분석된 지역을 보면 강서구, 기장군, 남 구, 사상구, 사하구, 서구, 수영구, 연제구, 영도구, 해운대구 등의 지역이며, SRIMA 모형의 경우, 금정구, 동래구, 부산진 구, 북구, 중구, 단일이동평균법의 경우 동구 지역에서 가장 높은 정확도를 보였다.
지역별로 보면 영도구 예측모형의 RMSE가 가장 낮은 0.0103이며, 다음 사상구 0.0145, 연제구 0.0.185, 기장군 0.0213, 수영구 0.0276 등의 순으로 나타나 이들 지역에서는 예측의 정확도가 매우 높게 나타났다. 반면 해운대구의 RMSE가 0.1823으로 여전히 정확도가 낮았으며, 다음 부산진 구 0.0995, 금정구 0.0793, 동래구 0.0505 등의 순으로 RMSE가 높아 정확도 측면에서 단순 시계열 모형이 관광객수를 예측 하는데 있어 한계가 존재하였다. 특히 해운대구와 부산진구 의 경우 관광객 강도가 높은 지역으로 외부 영향요인을 탐 색할 필요가 있다고 판단된다.
관광소비금액 시계열 모형 분석결과, 관광객수의 시계열 분석결과 유사하게 분의 지역에서 앞서 관광객수 분석결과 와 유사하게 이중이동평균법과 SRIMA 모형과 SARIMA 모 형이 가장 높은 정확성을 보였다. 최적 모형으로 이중이동 평균법이 가장 정확한 지역의 경우, 강서구, 금정구, 기장군, 남구, 동구, 동래구, 북구, 사상구, 사하구, 서구, 수영구, 연 제구, 영도구, 해운대구 등의 지역이며, SRIMA 모형의 경우, 부산진구, 중구 지역에서 가장 높은 정확도를 보였다.
지역별로 보면 영도구 예측모형의 RMSE가 가장 낮은 0.023 이며, 다음 서구 0.033, 사하구 0.054, 동구 0.055, 남구 0.064 등 의 순으로 예측의 정확도가 높게 나타났다. 관광소비금액 예 측 측면에서 SARIMA 모형이 최적의 모형으로 분석되었다.
반면 해운대구 0.401, 부산진구 0.307, 기장군 0.271, 중구 0.169 등의 순으로 RMSE가 매우 높아 정확도 측면에서 단순 시계열 모형이 관광객수 예측에 대한 한계가 존재하였다.
종합하면, COVID-19 고려 여부에 따라 정확도 측면에서 상당한 개선효과를 보였는데, 관광객수의 경우, 최소 1.8배 (해운대구), 최대 11.7배(사상구), 평균 5.3배 이상 향상되었 고, 관광소비금액의 경우 최소 3.0배(강서구), 최대 32.7배(사 하구), 평균 8.4배 향상되어, 전염성 바이러스로 인한 사회통 제는 외부 영향요인으로 고려되어야 한다(Yun and Lee, 2022). 또한 해운대구, 부산진구, 기장군 등은 앞서 언급한 바와 같이 관광객 강도가 높은 지역으로 외부 영향요인을 탐색할 필요가 있다고 판단된다.
4.3 다변량 시계열 분석 결과
외생변수를 고려한 시계열 분석방법인 SARIMAX를 활용 하여 관광객수에 대한 소비성향 요인 분석결과를 Table 6에 나타냈다. 즉 관광객수를 종속변수로, 숙박업, 쇼핑업, 여가 서비스업, 식음료업 등 업종별 소비금액을 소비강도(성향) 요인을 종속변수로, COVID-19를 더미변수로 설정하였다.
분석결과 동구를 제외한 대부분 지역의 관광객수에 대해 COVID-19가 유의한 변수로 작용하고 있다. 이는 COVID-19 와 같이 관광에 매우 큰 영향을 미치는 이벤트를 예측방법 에 고려해야 더 높은 정확성을 확보할 수 있음을 의미한다.
전반적으로 쇼핑업 소비성향과 식음료업 소비성향이 관 광객수 예측에 중요한 요인으로 확인이 되었으며, 반면 숙 박업 소비성향은 북구, 수영구, 해운대구 등 일부 지역에서 만 유의미한 영향을 미치고 있다(Kim et al., 2012).
지역별로 보면 강서구와 서구의 경우 쇼핑업과 식음료업, 기장군과 남구 동구, 동래구, 부산진구 등의 경우, 쇼핑업, 식음료업, 여가서비스업 등이 유의미한 영향요인을 분석되 었다. 또한 사상구, 연제구, 영도구, 중구 등의 경우 쇼핑업, 식음료업, 북구의 경우 숙박업, 식음료업, 사하구의 경우 쇼 핑업, 숙박업, 여가서비스업 등이 유의미한 요인이며, 해운 대구의 경우, 쇼핑업, 숙박업, 식음료업 등이 주요한 요인으 로 나타났다. 특히 수영구의 경우 모든 요인이 유의한 영향 을 미치고 있다. 다만 금정구의 경우는 특이하게 소비성향 에 따른 영향을 받지 않은 지역으로 분석되었다.
종합하면, 지역에 따라 차이가 존재하지만 숙박업, 쇼핑 업, 여가서비스업, 식음료업 등 업종별 소비강도(성향)는 관 광객수 예측 측면에서 중요한 고려 요인으로 판단된다.
다음은 관광객수에 대한 SNS 여행유형별 언급량 요인 분 석결과를 Table 7에 나타냈다. 즉 관광객수를 종속변수로, 레 포츠, 미식, 체험, 휴식, 기타 등의 유형의 트렌드로 구분하여 영향요인을 종속변수로, COVID-19를 더미변수로 설정하였다.
분석결과 소비성향 요인과 상이하게 일부 지역에서만 유 의한 영향력을 보였다. 구체적으로 강서구, 동구, 동래구, 사 하구, 서구, 영도구, 중구 등에서 여행유형별 관심도가 유의 한 관계를 보였으며 다른 지역은 여행유형별 관심도가 영향 을 미치지 못했다.
레포츠 관련 SNS 관심도의 경우, 동래구, 영도구, 중구 등 의 지역에서 주요한 영향요인으로 나타났다. 미식 관련 관 심도의 경우 사하구와 영도구 지역에서 관광객수에 영향을 미치는 것으로 분석되었다. 체험 SNS 관심도의 경우, 동구와 영도구에서, 휴식 관련 SNS 관심도의 경우 강서구와 서구에 서 유의한 영향을 미치고 있다.
마지막으로 관광소비금액에 대한 SNS 성향 영향요인 분 석결과를 Table 8과 같이 분석되었다. 분석결과 관광객수와 상이하게 SNS 성향이 영향요인으로 작용되는 지역이 상대 적으로 많았다. 구체적으로 강서구, 금정구, 동래구, 부산진 구, 사상구, 사하구, 서구, 수영구, 영도구, 해운대구 등의 지 역에서 유의한 영향을 미치고 있다.
유형별로 보면 레포츠 관련 SNS 관심도의 경우, 동래구와 서구 지역에서 주요한 영향요인으로 나타났다. 미식 관련 관심도의 경우 수영구와 영도구 지역에서 관광객수에 영향 을 미치는 것으로 분석되었다. 또한 체험 SNS 관심도의 경 우, 사하구에서 유의미한 영향력을 보이고 있으며, 휴식 관 련 SNS 관심도의 경우 강서구, 부산진구, 사상구, 사하구, 해 운대구 등의 지역에서 유의한 영향을 미치고 있다.
종합하면 관광객수와 관광소비금액에 대한 숙박업, 쇼핑 업, 여가서비스업, 식음료업 등 업종별 소비성향과 레포츠, 미식, 체험, 휴식 등과 같은 유형의 트렌드가 유의한 영향을 미치고 있으며, 수요 예측시 고려요인으로 판단된다.
4.4. 분석결과 종합
앞서 언급한 바와 같이 지역특성을 파악하기 위해 지역 내 2021년 문화 및 기타서비스업의 총생산가치를 Y축으로 해양관광 분야 종사자를 해양관광 공급요인으로 X축으로 나타내는 메트릭스 분석을 수행하였다. 즉 해양관광여건과 지역내 총생산가치를 표현하여 기초자치단체별 특성을 나 타냈다. 다만 관광여건은 자연환경, 콘텐츠, 관광 인프라, 명 성 등이 주요 요소이나 본 연구에서는 관광공급 측면에서 해양관광 사업체의 종사자를 해양관광여건으로 가정하였다.
Fig. 2와 같이 해양관광여건(종사자수)와 문화서비스업 규 모를 보면, 붉은 색으로 표기된 기장군, 사하구, 서구, 수영 구, 해운대 등이 해양관광여건이 높은 편으로 나타났다. 이 들 모두 기장군 일광해수욕장, 사하구 다대포해수욕장, 서구 송도해수욕장, 수영구 광안리해수욕장, 해운대구 해운대해 수욕장 등이 위치한 지역으로 해양관광여건이 높은 지역으 로 분석되었다.
내륙지역인 부산진구는 해양관광여건이 낮은 편이나 GRDP가 높게 나타났으며, 이는 부산의 대표적인 관광명소 인 서면 지역(부전동 및 전포동)의 관광 수요가 높기 때문이 다. 반면 금정구, 부산진구, 동래구, 북구 등은 상대적으로 낮게 나타났다. 메트릭스 분석결과 해양관광여건을 중심으 로 지역을 구분할 수 있으며, 금정구의 경우 COVID-19 영향 력이 없는 지역으로 나타났다. 또한 세모(△)로 표시된 해운 대구, 사하구, 수영구, 북구 등의 해양관광여건이 높은 지역 에서 숙박소비 성향이 주요한 영향요인을 분석되었다.
해양관광공급여건(종사자수)와 관광객수 규모의 메트릭스 를 Fig. 3과 같이 나타냈다. 분석결과를 보면, 앞서 분석한 문 화기타서비스업 총부가가치 생산규모 메트릭스와 지역에 따라 상이하게 나타났다. 즉 해양관광공급여건이 관광객 규 모를 보면, 해운대구의 경우 해양관광공급여건이 높고, 관광 객수가 높은 지역이다. 세모(△)로 표기된 기장군, 수영구, 남구, 동구, 사하구의 경우, 레저서비스업 소비 성향이 관광 객수 수요 예측의 고려요인을 의미한다.
5. 결 론
최근 국민 삶의질 향상, 여가 활동 다변화, 인구구조의 변 화 등으로 관광수요 증가와 다양한 관광활동에 대한 수요가 확대되고 있는 실정이다. 연안도시의 경우, 육상 관광 요소 와 해양관광 요소가 공존하는 지역으로 다양한 요인이 관광 수요에 영향을 미치고 있다. 분석데이터는 국내 대표적인 연안도시인 부산시를 대상으로 행위자 기반 데이터(이동통 신, 카드사용내역 등)를 활용하였다. 관광객 결정요인으로, 크게 기초자치단체 단위 월별 방문객수와 관광소비금액을 종속변수, 활동규모(레저서비스소비액, 숙박업소비액, 요식 업소비금액), 관광활동 유형(SNS 언급량) 등을 결정요인으로 설정하였다. 연구방법론으로시계열 데이터를 대상으로 확정 적(결정적) 모형을 활용하여, 요인별 영향력을 평가하고, 지 역 간 차이, 예측 정확도가 높은 모형을 탐색하였다.
본 연구는 관광객수 결정요인과 영향력을 도출하고, 이를 통해 관광정책의 기초자료와 정책 시뮬레이터 등과 같은 의 사결정 툴 개발에 기여하고자 한다.
변동계수를 비교한 결과, 지역 간 차이가 존재하며, 금정 구, 동구의 경우 변동계수가 크게 나타나, 관광수요의 변동 은 관광수용 규모 및 활동유형 공급측면에서 한계가 존재함 을 의미하며, 관광규모의 가변성을 고려한 수용태세를 갖출 필요가 있다.
시계열 분석결과, COVID-19 고려 여부에 따라 정확도 측 면에서 상당한 개선효과를 보였고, 관광객수의 경우, 최소 1.8배, 최대 11.7배, 평균 5.3배 이상 향상되었고, 관광소비금 액의 경우 최소 3.0배, 최대 32.7배, 평균 8.4배 향상되어. 전 염성 바이러스로 인한 사회통제는 외부 영향요인으로 고려 되어야 한다. 또한 정확도와 더불어 최적모형에도 차이가 있는데, 이벤트 고려 이전 모형에서는 대부분의 지역에서 SARIMA 모형의 정확도가 가장 높았으나, 이벤트를 고려한 경우에는 절반 이상의 지역에서 이중이동평균법이 최적 모 형으로 나타났다. 결국 SARIMA 모형보다 비교적 간단한 시 계열 분석만으로도 정확도가 향상되어, 타 지역에서도 충분 히 고려할 만한 관광객 예측모델로 판단된다.
다변량 시계열 분석 결과, 지역에 따라 차이가 존재하지 업종별 소비강도(성향)과 SNS 언급 트렌드가 관광수요 예측 측면에서 중요한 고려 요인으로 작용하였다. 관광객수와 관 광소비금액을 관광수요로 가정하여 영향요인을 종합하면, 숙박업, 쇼핑업, 여가서비스업, 식음료업 등 업종별 소비성 향이 관광객수 예측 측면에서 중요한 고려 요인이다. 또한 SNS의 레포츠, 미식, 체험, 휴식 등과 같은 유형의 트렌드가 유의한 영향을 미치고 있으며, 수요 예측시 고려요인으로 판단되며, 이는 잠재소비 성향으로 예측할 수 있다.
연구의 한계로 관광객수와 관광소비금액에 대한 영향요 인에 대한 양(+)과 음(-) 계수에 대한 원인을 파악하지 못하 였으며, 이는 관광영향요인이 지역 관광규모 영향력에 대한 긍정적 부정적 영향을 의미하나, 인과관계를 규명하지 못했 다. 한편 데이터 기간 중 이벤트 기간이 정상적 기간보다 상 대적으로 많아 COVID-19 팬데믹 이후의 시계열 자료를 활 용하여 분석할 필요가 있다. 또한 본 연구에서는 확정적 모 델을 중심으로 예측분석을 수행했으나 향후에는 확률적 모 델(Stochastic model)을 활용한 수요예측 및 민감도 분석을 통 해 수요예측의 정확성을 향상시키고자 한다.