成像原理調整:根據水的活性指數對水下相機的光學系統進行最佳化。水的折射率約為1.33,與空氣的折射率不同,導致光的折射。因此,鏡頭設計需要考慮這些因素,以確保影像相對清晰。例如,使用特殊的廣角鏡頭可以在一定程度上減少因重力造成的影像失真。
影像預處理:由於水下環境複雜,影像常常需要進行預處理來校正顏色和增強對比。這包括顏色校正(補償水吸收的特定波長的光)和對比度增強(因為水下影像通常具有較低的對比度)。直方圖均衡等方法可以改進,使其更容易區分目標物和背景。
特徵提取
形狀特徵:形狀是水下目標辨識的關鍵特徵。因為,在水下考古中,古代沉船碎片的形狀可能是不規則的塊體或具有特定的幾何形狀。邊緣偵測演算法,如Canny偵測,可以用來提取目標物體的邊緣輪廓,作為辨識的重要線索。
紋理特徵:許多水下目標具有獨特的紋理。例如,珊瑚礁的紋理複雜而細膩,而魚鱗則有其獨特的紋理。利用灰階共生等紋理分析方法,可以提取目標物體的紋理特徵,包括粗糙度和方向性,用於辨識。
顏色特徵:雖然顏色可能會失真,但在某種程度上仍然可以用作特徵。例如,一些熱帶魚的顏色鮮豔。透過提取顏色直方圖或從顏色校正影像中計算顏色矩,我們可以使用顏色特徵來輔助識別。此外,不同的水下生物或物體在特定的光譜帶下可能具有獨特的顏色特徵。
目標識別演算法
基於模板匹配的演算法:如果目標物體的形狀特徵明確,例如在水下管道檢查中,預先知道管道的形狀和尺寸,則可以將目標物體的模板圖像與捕獲的圖像進行匹配圖像。透過計算相似性度量,例如歸一化相互關係數,可以確定目標物件的存在和位置。
機器學習演算法:
監督學習:這涉及使用帶有標籤的水下圖像資料集進行訓練。例如,如果有各種類型的魚的標記圖像,則可以使用形狀紋理和顏色等特徵作為輸入,並將魚的類型作為輸出標籤。支援向量機 (SVM) 和決策樹等演算法可用於分類訓練。然後,訓練後的模型可用於識別新水下影像中的魚類類型。
無監督學習:這是針對沒有先驗知識的目標,例如海底新發現的未知生物群落。聚類演算法,例如K-means聚類,可以根據目標的特徵對目標進行分組,然後進一步分析每個組內的目標。
深度學習演算法:
卷積神經網路(CNN):這是水下目標識別的有效方法。例如,可以建構具有多個卷積層、池化層和全連接層的 CNN。透過使用大量水下影像作為訓練數據,網路可以自動學習目標物體的高級特徵。例如,在識別水下機器人的目標時,例如礦物或沉船的一部分,CNN可以學習這些目標的複雜特徵,從而實現高精度識別。
多重融合(可選)
與聲納感測器融合:在水下環境中,聲納可以提供有關目標物體的距離和大小的資訊。透過水下攝影機和聲納感測器的數據,可以更全面地了解目標物體。例如,在水下搜救行動中,AR可以檢測潛在人類目標的大致位置和範圍,然後水下攝影機可以利用這些資訊進行精確的視覺識別,以確定是否是目標。
與光學感測器融合:如果水下相機是多光譜相機,則可以與其他光學感測器(例如LiAR)融合,以增強目標識別能力。不同的光學感測器可以提供目標物體不同的特徵訊息,透過融合這些信息,可以提高目標識別的準確性和穩健性。