Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1229-3431(Print)
ISSN : 2287-3341(Online)
Journal of the Korean Society of Marine Environment and Safety Vol.31 No.5 pp.795-801
DOI : https://doi.org/10.7837/kosomes.2025.31.5.795

Estimating Exhaust Gas Temperature of a Propulsion Engine Using Random Forest

Shinhyo Kim*, Seunghun Lim**, Jinkyu Park***, Jungmo Oh***
*M.S Course, Department of Marine Engineering, Graduate School of Mokpo National Maritime University, Mokpo 58628, Korea
**Ph.D Course, Department of Marine Engineering, Graduate School of Mokpo National Maritime University, Mokpo 58628, Korea
***Professor, Division of Marine System Engineering, Mokpo National Maritime University, Mokpo 58628, Korea

* First Author : rainbowfin1@naver.com


Corresponding Author : jmoh@mmu.ac.kr, 061-240-7207
August 21, 2025 September 23, 2025 October 28, 2025

Abstract


Engine failure on ships has a significant impact not only on maritime safety but also on economic factors. According to domestic marine accident statistics of 2024, engine failure accidents accounted for 40% of simple accidents. This shows that engine damage is a very important factor in ship safety. Engine failure on ships can occur due to various mechanical defects, and these effects are directly reflected in ship exhaust gas temperature changes. Therefore, this study developed a model to predict ship exhaust gas temperature and prevent engine failure in advance. We collected data from a training ship. Data processing, it revealed that the data exhibited non-normality. Hence, Spearman correlation and least absolute shrinkage and selection operator (LASSO) regression analyses were conducted to derive a total of six variables. Subsequently, GridSearchCV was utilized to optimize the parameters of the random forest model. Model performance was validated through residual distribution scatter plots of predicted versus actual values, and other quantitative indicators.



Random Forest를 활용한 주 추진 엔진의 배기가스 온도 예측

김신효*, 임승훈**, 박진규***, 오정모***
*국립목포해양대학교 대학원 기관시스템공학과 석사과정
**국립목포해양대학교 대학원 기관시스템공학과 박사과정
***국립목포해양대학교 기관시스템공학부 교수

초록


선박의 기관 고장은 해상 안전성뿐만 아니라 경제적 요인에도 큰 영향을 미친다. 2024년 국내 해양 사고 통계에 따르면 단순 사고 중 기관 고장이 차지하는 비율은 40%이다. 이는 기관 손상이 선박 안전에 매우 중요한 요소임을 보여준다. 선박 기관 고장은 다양한 기계적 결함에 의해 발생하며, 이러한 영향은 선박 배기가스 온도 변화에 직접적으로 나타난다. 따라서 본 연구에서는 선박 배기가스 온 도를 예측하여 선박 기관 고장을 사전에 방지할 수 있는 모델을 개발하였다. 본교 실습선에서 수집한 데이터를 활용한 시계열 운항 데이 터를 수집하였고, 수집된 데이터 전처리 과정을 통해 비정규성을 나타낸다는 것을 밝혀냈다. 이에 따라서 Spearman 상관관계 분석법과 LASSO 회귀 분석법을 통해 총 6개의 변수를 도출했다. 이후, Random Forest 모델의 파라미터를 최적화하기 위해서 GridsearchCV를 활용하 였고, 모델 성능을 잔차 분포, 실제값 대비 예측값 산점도 및 정량적 지표를 통해 검증하였다.



    1. 서 론

    선박의 기관 고장은 단순한 기계적 결함을 넘어 해상 안 전성과 경제성에 가장 영향을 미치는 중요한 요인 중 하나 이다. 이러한 기관 고장은 막대한 수리 비용과 더불어, 경제 적 피해를 초래할 수 있다. 해양수산부에서 2025년 03월 24 일에 공표한 2024년 국내 해양 사고 통계에 따르면, 전체 해 양 사고는 3,255건으로 전년도 대비 5% 증가하였다. 그중 단 순 사고에서는 기관 손상 관련사고는 1,023건으로 약 40%를 차지하였다. 이는 단순 사고 중에서 기관 손상 사고가 차지 하는 비중이 매우 높다는 것을 알 수 있다. 따라서 기관 손 상 사고는 선박의 안전에 직접적인 영향을 미치는 원인 중 하나임을 의미하며, 가장 위험한 요인이기도 하다.

    선박 기관 고장은 엔진 고장(윤활유 부족, 부품 마모, 과 열 등), 배기 밸브 누설, 연소 불량, 연료 문제, 터보차저 결 함 등 다양한 기계적 결함으로 나타난다. 이러한 기계적 결 함은 엔진의 연소 효율과 열전달에 직접적인 영향을 미치 며, 이 영향의 결과는 배기가스 온도에 나타난다. 따라서 배 기가스 온도를 예측할 수 있다면 선박 기관 고장을 조기에 예방할 수 있는 가능성을 제공한다. 본 연구에서는 머신러 닝 알고리즘을 이용하는 Random Forest를 이용해 선박 배기 가스 온도를 예측하여 선박 기관 고장을 조기에 예방하는 모델을 개발하고자 한다.

    최근 연구에서는 선박 배기가스 온도 데이터를 활용하여 선박 엔진의 결함 진단 및 예측 가능성을 제시하였다. SVM, ANN, LGBM, Random Forest 등 다양한 머신러닝 모델을 사용 하여 연구를 진행하였고, 그중 Random Forest의 정확도가 92.383%로 가장 우수한 성능을 보였다(Kim et al., 2024). 이러 한 선행 연구를 바탕으로 Random Forest 회귀 모델을 사용하 여 선박 배기가스 온도를 예측하자고 한다.

    Random Forest는 1996년 Breiman이 제시한 모델로써 여러 개의 의사 결정 트리(Decision Tree)를 앙상블 학습(Ensemble Learning)하여 하나의 모델로 만드는 머신러닝 알고리즘이다. 의사 결정 트리는 무작위로 추출하여 학습되고, 분활하는 과정 또한 무작위로 진행되어 상관성이 낮은 트리를 생성한 다. 따라서 높은 과적합과 낮은 정확도를 개선할 수 있다. Random Forest는 분류와 회귀 문제를 동시에 적용할 수 있어 용이하다(Cho et al., 2025;Kim et al., 2021). 최근에는 다양한 산업 분야에서도 Random Forest 회귀 모델이 활용되고 있다.

    본 연구에서는 Random Forest 회귀를 적용하여 선박 배기가 스 온도를 예측하고, 이를 통해 선박 기관 손상을 예방하기 위한 방법론을 제시하고자 한다. 운항 중 취득 가능한 변수를 활용하여 배기가스 온도 예측 모델을 개발하고, 이를 통해 엔 진 이상 징후를 조기에 진단할 수 있는 방안을 제시한다.

    2. 관련연구

    Yan et al.(2020)은 dry bulk ship의 운항 데이터를 활용하여 연료 소비량을 예측하고 이를 기반으로 선박의 최적화된 운 항 속도를 예측하여 연료 및 탄소 배출 저감을 이끌 수 있는 2단계의 선박 연료 소비량 예측 및 절감 모델에 대해 연구 하였다. 연구에 쓰인 주요 변수로는 선박 항해 속도, 파도 높이, 적재 화물 총중량, 해상 및 기상 조건 등이 쓰였으며, 첫 번째 단계에서는 Random Forest 회귀 모델을 활용하여 연 료 소비량 예측 모델을 개발하였다. 두 번째 단계에서는 첫 번째 단계에서 개발된 모델을 기반으로 항구 도착 예상 시 간을 예측하여 이에 따르는 속도 최적화 모델을 개발하였 다. 연구 결과 선박 연료 소비량을 2~7% 절감할 수 있음을 보여주었고, 이는 CO2 배출 저감으로 해석된다. 이 연구는 연료 소비량 예측뿐만 아니라 선박의 최적 운항 속도를 예 측함으로써 에너지 효율 개선 방안을 제시하였다. 향후 선 박 데이터와 해양 기상 예보 데이터를 통합하여 더 향상된 연로 소비량 예측과 정밀한 선박 운항 속도 최적화 모델을 개발할 예정임을 밝혔다(Yan et al., 2020).

    Thurston et al.(2023)는 디젤 엔진의 연료 분사기 손상을 조 기에 진단하기 위해 EGT(exhaust gas temperature)를 기반으로 배기가스 온도 예측 모델과 연료 분사기 고장 예지 지표를 개발하였다. 실험 대상은 1,350bar Bosch 커먼레일 연료 분사 기 시스템을 갖춘 Cummins ISC 엔진을 대상으로, 배기가스 온도는 각 실린더 배기관에 설치된 열전대 센서를 통해 EGT를 측정하였다. 실린더별 측정된 배기가스 온도와 엔진 속도, 연료 온도, 냉각수 온도 등의 변수로 2단계 선형 회귀 모델을 개발하였다. 그 후 각 실린더에 대해 측정된 실제 EGT와 모델이 예측한 EGT의 차이를 기준으로 손상 진행 정 도를 수치화하였다. 이 연구는 디젤 엔진의 연료 분사기 고 장 예측 진단 기술을 제시하였고, 선박 예측 진단의 중요성 을 주장하였다(Thurston et al., 2023).

    Puzdrowska(2021)은 선박 디젤 엔진의 배기가스 온도의 Quickly Changing Temperature를 분석하여 선박의 구조적 조기 결함 진단 가능성을 연구하였다. 실험실 내에 설치된 D10형 4행정 단기통 Faryman 디젤 엔진을 활용하였다. 흡입 공기 통로의 단면적 축소, 연로 이젝터 개방 압력 감소, 압축비 감소 총 3가지 구조 매개변수를 단계적으로 조정하여 변화 를 유도하였다. 그 결과, 배기가스 온도의 급격한 변화가 선 박의 결함과 밀접한 연관이 있다는 것을 밝혀냈다. 특히 배 기가스 온도를 기반으로 개발된 예지 정비 알고리즘으로써 향후 선박 고장 예측 분야에 유용하게 활용될 수 있는 연구 로 간주된다(Puzdrowska, 2021).

    Kim et al.(2019)은 13K TEU급 컨테이너 선박으로부터 수 집한 운항 데이터를 활용해 선박 연료 소비 예측 모델을 개 발하였다. 주성분 분석을 통해 총 4개의 주성분을 추출하였 고, 선박 추진 성분, 선박의 하중 성분, 선박 외력 성분, 타각 성분으로 나누었다. 개발된 연료 소비량 모델 예측 결과 실 제 연료 소비량과 비교하여 하루 4.1ton 정도의 차이가 났으 며 연료 소비 경향을 예측하기에 적합한 것으로 나타났다. 추후 모델 정확도 향상을 위해 기계 학습 방법 도입을 제안 하였다(Kim et al., 2019).

    3. 실험 방법

    목포해양대학교에서 운용 중인 실습선의 실제 운항 데이 터와 실습선에 탑재된 엔진을 대상으로 3개월간 수집한 실 제 운항 데이터를 활용하여 배기가스 온도 예측 모델을 개 발하였다.

    3.1 연구 대상 선박

    Table 1과 같은 사양의 2018년도에 건조된 9,196t급 실습선 엔진을 대상으로 실제 운항 데이터를 통해 데이터를 취득하 였다.

    3.2 실험 환경

    본 연구에 사용된 실험 환경은 다음 Table 2와 같다. 모델 학습은 Python(3.12.7)에서 실행되었고, 주요 라이브러리는 Scikit-Learn을 사용하였다.

    3.3 데이터 전처리

    본 연구에서 활용된 데이터 셋은 총 93.075개이며, 이를 Train, Test, Validation 데이터로 7:2:1의 비율로 분할하여 학습 에 활용하였다.

    선박 운항 중 취득한 다양한 데이터와 배기가스 온도 사 이의 상관관계를 파악하기에 앞서 각 변수의 분포 특성을 알아내기 위해 시계열 데이터의 정규성 검증을 수행하였다. Sapiro-Wilks Test 결과 시계열 데이터들의 P-value 값이 0.05 이하로 나타나 정규성을 만족하지 않는 것으로 나타났으며, 이에 따라 비정규성 분포의 상관관계 방법인 Spearman correlation analysis를 적용하여 데이터들의 상관계수를 도출 하였다. 분석 결과를 기반으로 유의한 상관계수를 가지는 데이터와 도메인 지식 상으로 배기가스 온도와 밀접한 관계 인 주요 변수 14개를 1차로 선별하였다.

    1차로 선별된 변수 경향성을 시각적으로 검토하기 위해 산점도를 작성하였다. 또한, 각 변수 데이터의 결측치 및 이 상값을 제거하여 선별된 변수 데이터의 신뢰성을 높였다. 이후, 변수 선택에 있어서 대표적인 머신러닝 기법중 하나 인 LASSO 회귀 분석법을 통해 불필요한 변수를 제거하였다. LASSO 회귀는 독립 변수들 사이의 다중공선성을 줄이는 동 시에 변수 선택이 가능하다는 점에서 유용하게 쓰인다(Park, 2024). 이 과정에서 LASSO 규제 파라미터인 Alpha 값을 최적 화하기 위해 별도로 0.1~1.0까지 0.1 간격으로 실험을 진행했 고, 각 Alpha 값에 대해 평균제곱오차(MSE), 결정계수(R²)를 분석했다.

    3.4 모델 학습 및 평가 방법

    LASSO 회귀법을 통해 신뢰성 확보가 된 변수들을 바탕으 로 Random Forest 회귀 모델을 구축하였다. Random Forest는 널리 사용되는 머신러닝 알고리즘으로, 다변수 데이터 사이 에서 Bagging의 기술을 사용하여 여러 Decision Tree의 결과 를 결합하여 예측값을 도출하는 알고리즘이다. 분류와 회귀 문제를 모두 처리할 수 있는 편의성과 유의성으로 선택하게 되었다(Lee, 2020).

    Random Forest 회귀 모델은 일반화 능력이 낮은 복잡한 트 리를 생성하기 때문에 특성상 과적합 되기 쉽다(Kim et al., 2024). 따라서 모델의 과적합을 방지하기 위해, GridsearchCV 기반 하이퍼파라미터 Tuning 수행했다. Tuning 과정은 GridsearchCV를 활용한 파라미터의 조정이 Random forest의 성능을 향상시킬 수 있다는 선행 연구에 기반하여 수행하였 다(Sumathi, 2020). 총 12,096개의 하이퍼파라미터 조합에 대 해 5-Fold 교차 검증(총 60,480회)을 실시하였고, 평가 지표로 는 Test 데이터와 Validation 데이터의 MSE(Mean Squared Error)와 R²(R-Squared)을 사용하였다. 실험에 사용된 주요 하 이퍼파라미터는 위 Table 3과 같다.

    Table 3에 정리된 하이퍼파라미터 값을 적용하여 학습한 결과, 모델은 테스트 데이터에서 MSE=1.2683, R²=0.9949으로 초기 데이터 전처리를 위해 사용한 LASSO 회귀의 평가 지 표와 비교했을 때 향상된 성능을 보여준다.

    Random forest 회귀 모델 성능 평가로는 MSE, RMSE, MAE, R² 을 사용하였다. 모델의 성능을 직관적으로 평가할 수 있 기에 선택하였다(Ma et al., 2024).

    MSE(mean squared error)는 평균 제곱 오차로 실제값과 예 측값의 차이를 제곱하여 평균한 것이다.

    M S E = 1 n i = 1 n ( y i y i ' ) 2
    (1)

    RMSE(root mean squared error)는 제곱근 평균 제곱 오차로 MSE와 같은 원리로 해석된다.

    R S M E = 1 n i = 1 n ( y i y i ' ) 2
    (2)

    MAE(mean absolute error)는 평균 절대 오차로 실제값과 예 측값의 차이를 절댓값으로 변환한 후, 합산하여 평균을 구 한 것이다.

    M A E = y i y i ' n
    (3)

    R²(R-square)은 보정된 결정계수로 실제값의 분산 대비 예 측값의 분산 비율을 계산해 상대적인 성능을 구한 것이다.

    R 2 = 1 i = 1 n ( y i y ' i ) 2 i = 1 n ( y i y ¯ ) 2
    (4)

    4. 결과 및 고찰

    4.1 주요 변수 선정

    Lasso 회귀 분석법을 활용하여 Alpha=0.1일 때, 평균 제곱 오차(MSE)=17.359, 결정계수(R²)=0.9330으로 최적의 규제 파 라미터를 선정하였다. 이를 바탕으로 최종 6개의 독립 변수 를 선정했고, 선정된 독립 변수는 다음과 같다.

    Fig. 1은 Random Forest 모델을 이용된 변수들의 중요도를 백분율로 나타낸 것이다. 분석 결과 MAIN ENGINE LOAD와 M/E HFO CONSUMPTION 변수가 예측 성능에 가장 크게 작 용하였다. 그 외에도 M/E NO.1 PCO OUTLET TEMP와 M/E A/C C.W OUTLET TEMP 등의 변수도 평균 이상의 중요도를 가지는 것으로 나타났다. 이러한 결과는 종속 변수와 독립 변수 간에 밀접한 상관관계가 존재함을 시사한다.

    4.2 모델 예측 결과

    Fig. 2는 모델의 예측 성능을 시각적으로 확인하기 위해 실제값과 예측값을 산점도로 표현한 것이다. Fig. 3은 시계열 데이터에 대한 실제값과 예측값을 산점도로 나타내고, Fig. 4는 특정 구간(X-axis)을 확대하여 실제값과 예측값의 차이를 산점도로 나타낸 것이다. 전반적으로 예측값이 실제값과 유 사한 경향을 보이나, 특정 구간(X-axis : 5000-10000)에서 오차 가 발생했음을 볼 수 있다. 구체적으로 데이터값이 높은 구 간은 정확한 값을 예측하였으나, 데이터가 낮은 구간에서는 예측 오차가 증가하였다. 이는 시계열 데이터 내에서 낮은 구간에 해당하는 데이터가 높은 구간에 해당하는 데이터에 비해 부족하여 모델이 특정 구간의 패턴을 학습하는 데에 한계가 있음이 원인으로 해석된다.

    Fig. 5는 실제값과 예측값의 잔차를 산점도로 표현하였 다. 잔차는 0 부근에 집중되어 있고 특정 부분에서 편향이 나타나지 않았다. 다만, 앞서 제시한 예측값과 실제값 비교 산점도에서 언급한 바와 같이, 특정 구간에서는 다른 구간 에 비해 높은 잔차가 관측되었으며, 이는 해당 모델이 특정 구간을 충분히 학습하지 못한 것으로 해석된다. 추후 연구 에서는 모델의 학습 부족 구간의 데이터를 수집하여 모델 의 일반화 성능을 향상시키는 방안을 모색할 예정이다.

    4.3 모델 성능 정량적 평가

    Table 4는 본 연구에서 개발한 모델에 대한 성능 평가 결 과를 표로 나타낸 것이다. 분석 결과, Train 데이터에서는 Test 데이터와 Validation 데이터에 비해 낮은 오차와 높은 R²(결정계수)를 보였다. Test 데이터와 Validation 데이터를 비 교했을 때, 서로 유사한 결과값을 보였으며 안정적인 성능 을 나타냈다. 특히 MAE(평균 절대 오차)는 모델의 평균 오 차 크기를 명확하게 측정하며 모든 차원 평가의 중심이 되 는 지표로서, 예측 모델의 핵심적인 정확성 평가로 활용된 다(Willmott and Matsuura, 2005). 본 연구 모델의 MAE(평균 절대 오차)는 0.7555로 예측값과 실제값의 평균 차이가 1 미 만으로 낮은 수준이다. 또한, R²(결정계수) 0.995로 높게 나 왔다.

    이는 기존 연구에서 제시한 실무 적용 가능 모델 기준인 R²≥0.7을 만족하는 결과이다. 즉, 본 모델은 ± 1~2 범위의 오차를 허용하며 실무적으로 충분한 정확도를 나타낸다 (Portela, 2024) 그러나, Train 데이터와 Test 데이터 비교했을 때 Test 데이터에서 일부 성능 차이가 발생했으며, 이것은 특정 데이터에서 과적합 성향을 보이는 것으로 해석된다. 해양 분야에서는 환경 변수의 급격한 변화로 데이터의 다양 성과 모델 일반화 성능 확보가 중요하다. 향후 연구에서는 다양한 데이터 다양성 확보와 정규화 기법을 통해 Train 데 이터와 Test 데이터 성능 차이를 최소화할 수 있을 것으로 기대된다.

    최종적으로 본 연구에서 개발한 선박 배기가스 온도 예측 모델은 실제 적용 가능한 정확도와 신뢰도를 지니고 있으 며, 독립된 검증 데이터셋을 기반으로 높은 성능을 확인하 였기에, 개발한 알고리즘이 실제 환경에서도 확장 가능성이 높다고 판단된다. 향후 데이터 다양성의 확보와 모델의 일 반화 성능을 강화할 경우, 더욱 안전하게 활용 가능할 것으 로 예측된다. 또한, 해양 산업뿐만 아니라 다양한 산업 분야 에서 확장 가능성 또한 지니고 있어, 응용 범위가 넓어질 것 으로 기대된다.

    5. 결 론

    본 연구에서는 운항 데이터를 기반으로 선박 배기가스 온 도를 예측하고, 이를 통해 선박 기관 고장을 예방하는 예측 모델을 개발하였다.

    시계열 데이터 정규성 검증 결과 비정규성으로 나타났으 며 이에 따라 Spearman 상관분석을 수행하였다. 도메인 지식 과 통계 분석을 바탕으로 14개의 주요 변수를 선정하였고, 이후 결측치 제거를 통해 데이터 변질을 예방하였다. LASSO 회귀분석으로 다중공선성을 제거하고 최종 6개의 변 수를 도출하였다.

    이러한 데이터 전처리 과정을 통해서 Random Forest에 사 용될 6개의 변수를 도출하였고, GridSearchCV를 기반으로 하 이퍼파라미터를 최적화하였다. 최적화된 하이퍼파라미터를 적용하여 모델을 학습시킨 후 학습된 모델의 성능을 시각적 으로 평가하기 위해 실제값과 예측값의 비교 산점도와 잔차 분포를 작성하였다. 분석 결과, 잔차가 0부근에서 집중되고 특정 영역에 편향되지 않을 것을 보아 모델이 데이터의 주 요한 패턴을 잘 반영한 것으로 확인되었다. 다만, 낮은 구간 에서는 잔차의 크기가 높게 나타났는데, 이는 데이터 다양 성이 부족하여 모델이 특정 구간의 패턴을 충분히 학습하지 못한 것으로 판단된다. 또한 모델의 정량적 평가를 위해 성 능 지표를 작성하였다. 성능 지표 결과, Test 데이터에서 MSE=1.262, R²=0.9949의 성능을 보였다. 이는 LASSO 회귀 기 반 성능 평가와 비교했을 때 향상된 결과를 보여준다.

    본 연구에서 개발된 선박 배기가스 온도 예측 모델은 실 제 사용 가능한 정확도와 신뢰성을 지니고 있다. 이를 기반 으로 선박 기관 고장 진단 및 예방에 효과적으로 활용할 수 있다. 특히 측정 가능한 운항 데이터를 활용하여 배기가스 온도 변화 추이를 분석하고, 엔진의 이상징후를 예측하여 예 지정비를 실행함으로써 불필요한 정비 비용과 운항 손실을 줄이는 알고리즘을 제안하였다. 따라서 본 연구는 선박 기관 고장 및 예방 정비 기술 개발에 기여될 것으로 기대된다.

    Acknowledgements

    이 논문은 2025년도 정부(교육부)의 재원으로 한국연구재 단 국립대학육성사업의 지원을 받아 수행된 연구임.

    Figure

    KOSOMES-31-5-795_F1.jpg

    Selected Features and importance from LASSO regression.

    KOSOMES-31-5-795_F2.jpg

    Comparison of Actual values & Predicted values using LASSO regression.

    KOSOMES-31-5-795_F3.jpg

    Actual values vs. Predicted values of Exhaust Gas Temperature.

    KOSOMES-31-5-795_F4.jpg

    Detail view of Actual values vs. Predicted values of Exhaust Gas Temperature (X-axis : 5000-10000).

    KOSOMES-31-5-795_F5.jpg

    Residual plot (Actual values vs. Predicted values of Exhaust Gas Temperature).

    Table

    Main engine’s specifications

    Hardware and Software Environment

    Best hyperparameters for proposed model

    Quantitative evaluation results of model

    Reference

    1. Cho, S., Y. -O. Choi, and S. Kim ( 2025), Probabilistic Modeling of Occupational Hazard Severity and Causal Variables in Construction Operations Using Random Forest Algorithms, Journal of the Korea Institute of Building Construction, 25(2), pp. 195-206.
    2. Lee, D. and S. Lee ( 2020), Hourly Prediction of Particulate Matter (PM2.5) Concentration Using Time Series Data and Random Forest, KIPS Transactions on Software and Data Engineering, 9(4), pp. 129-136.
    3. Kim, R. M., K. M. Kim, and J. -H. Ahn ( 2021), Comparison between random forest and recurrent neural network for photovoltaic power forecasting, Journal of Korean Society of Environmental Engineers, 43(5), pp. 347-355.
    4. Kim, T., S. Kim, and C. -J. Chun ( 2024), Main engine fault diagnostics and prognostics using exhaust gas temperature data, Autumn Annual Conference of KIIE, Oct.2024.
    5. Kim, Y. -R., G. Kim, and J. -B. Park ( 2019), A Study on the Prediction of Fuel Consumption of a Ship Using the Principal Component Analysis, Journal of Navigation and Port Research 43(6), pp. 335-343.
    6. Ma, L., Z. Guo, and G. Shi ( 2024), AIS Data Driven Ship Behavior Modeling in Fairways: A Random Forest Based Approach, Applied Sciences, 14(18), 8484.
    7. Park, M. -H. ( 2024), Variable Selection for Trade Facilitation and the Income Level of Trading Countries in Exports by Firm Size: A Comparative Analysis of Stepwise and Lasso Regression, Journal of CEO and Management Studies, Vol. 27, No. 1, pp. 275-288.
    8. Portela, F., J. J. Sousa, C. Araújo-Paredes, E. Peres, R. Morais, and L. Pádua ( 2024), A systematic review on the advancements in remote sensing and proximity tools for grapevine disease detection, Sensors, 24(24), 8172.
    9. Puzdrowska, P. ( 2021), Diagnostic information analysis of quickly changing temperature of exhaust gas from marine diesel engine. Part i single factor analysis, Polish Maritime Research 4 (112), pp. 97-106.
    10. Sumathi, B. ( 2020), Grid search tuning of hyperparameters in random forest classifier for customer feedback sentiment prediction, International Journal of Advanced Computer Science and Applications, 11(9).
    11. Thurston, M. G., M. R. Sullivan, and S. P. McConky ( 2023), Exhaust-gas temperature model and prognostic feature for diesel engines, Applied Thermal Engineering, 229, 120578.
    12. Willmott, C. J. and K. Matsuura ( 2005), Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance, Climate research 30(1), pp. 79-82.
    13. Yan, R., S. Wang, and Y. Du ( 2020), Development of a two-stage ship fuel consumption prediction and reduction model for a dry bulk ship, Transportation Research Part E : Logistics and Transportation Review, 138, 101930.