इमेजिंग सिद्धांत समायोजन: पानी के नीचे के कैमरों की ऑप्टिकल प्रणाली पानी के सक्रिय सूचकांक के आधार पर अनुकूलित होती है। पानी का अपवर्तनांक लगभग 1.33 है, जो हवा से अलग है, जिससे प्रकाश का अपवर्तन होता है। इसलिए, लेंस डिज़ाइन को अपेक्षाकृत स्पष्ट छवियों को सुनिश्चित करने के लिए इन कारकों पर विचार करने की आवश्यकता है। उदाहरण के लिए, विशेष वाइड-एंगल लेंस का उपयोग करके कुछ हद तक अपवर्तन के कारण होने वाली छवि विकृति को कम किया जा सकता है।
छवि प्रीप्रोसेसिंग: पानी के अंदर के जटिल वातावरण के कारण, छवियों को अक्सर रंग सही करने और कंट्रास्ट बढ़ाने के लिए प्रीप्रोसेसिंग की आवश्यकता होती है। इसमें रंग सुधार शामिल है, क्योंकि पानी द्वारा अवशोषित प्रकाश की विशिष्ट तरंग दैर्ध्य के लिए क्षतिपूर्ति की जाती है, और कंट्रास्ट वृद्धि, क्योंकि पानी के अंदर की छवियों में आमतौर पर कम कंट्रास्ट होता है। हिस्टोग्राम इक्वलाइजेशन जैसी विधियाँ इसे बेहतर बना सकती हैं, जिससे लक्ष्य वस्तुओं को पृष्ठभूमि से अलग करना आसान हो जाता है।
सुविधा निकालना
आकार की विशेषताएँ: आकार पानी के अंदर लक्ष्य की पहचान के लिए एक महत्वपूर्ण विशेषता है। क्योंकि, पानी के अंदर पुरातत्व में, प्राचीन जहाज़ के मलबे के टुकड़ों का आकार अनियमित ब्लॉक या विशिष्ट ज्यामितीय आकार हो सकता है। कैनी डिटेक्शन जैसे एज डिटेक्शन एल्गोरिदम का उपयोग लक्ष्य वस्तुओं के किनारे की रूपरेखा निकालने के लिए किया जा सकता है, जो पहचान के लिए महत्वपूर्ण सुराग के रूप में काम करते हैं।
बनावट विशेषताएँ: कई पानी के नीचे के लक्ष्यों की बनावट अनोखी होती है। उदाहरण के लिए, कोरल रीफ में जटिल और नाजुक बनावट होती है, जबकि मछली के तराजू की अपनी अलग बनावट होती है। ग्रे-लेवल सह-घटना जैसी बनावट विश्लेषण विधियों का उपयोग करके, हम लक्ष्य वस्तुओं की बनावट विशेषताओं को निकाल सकते हैं, जिसमें खुरदरापन और दिशात्मकता शामिल है, जिसका उपयोग पहचान के लिए किया जा सकता है।
रंग विशेषताएँ: हालाँकि रंगों को विकृत किया जा सकता है, फिर भी उन्हें कुछ हद तक एक विशेषता के रूप में इस्तेमाल किया जा सकता है। उदाहरण के लिए, कुछ उष्णकटिबंधीय मछलियों के रंग चमकीले होते हैं। रंग हिस्टोग्राम निकालकर या रंग-सुधारित छवियों से रंग क्षणों की गणना करके, हम पहचान में सहायता के लिए रंग विशेषताओं का उपयोग कर सकते हैं। इसके अतिरिक्त, अलग-अलग पानी के नीचे के जीवों या वस्तुओं में विशिष्ट वर्णक्रमीय बैंड के तहत अद्वितीय रंग विशेषताएँ हो सकती हैं।
लक्ष्य पहचान एल्गोरिदम
टेम्पलेट मिलान-आधारित एल्गोरिदम: यदि लक्ष्य वस्तु की आकृति विशेषताएँ अच्छी तरह से परिभाषित हैं जैसे कि पानी के नीचे पाइपलाइन निरीक्षण में जहाँ पाइपलाइन का आकार और आकार पहले से ही ज्ञात है, तो लक्ष्य वस्तु की टेम्पलेट छवि को कैप्चर की गई छवि से मिलान किया जा सकता है। समानता मापों की गणना करके, जैसे कि सामान्यीकृत क्रॉस-सहसंबंध गुणांक, लक्ष्य वस्तु का अस्तित्व और स्थिति निर्धारित की जा सकती है।
मशीन लर्निंग एल्गोरिदम:
पर्यवेक्षित अधिगम: इसमें लेबल वाले अंडरवॉटर इमेज डेटासेट के साथ प्रशिक्षण शामिल है। उदाहरण के लिए, यदि विभिन्न प्रकार की मछलियों की लेबल वाली छवियां हैं, तो आकार बनावट और रंग जैसी विशेषताओं को इनपुट के रूप में इस्तेमाल किया जा सकता है, और आउटपुट लेबल के रूप में मछली के प्रकार का उपयोग किया जा सकता है। वर्गीकरण प्रशिक्षण के लिए सपोर्ट वेक्टर मशीन (SVM) और निर्णय वृक्ष जैसे एल्गोरिदम का उपयोग किया जा सकता है। प्रशिक्षित मॉडल का उपयोग नई अंडरवॉटर छवियों में मछलियों के प्रकारों की पहचान करने के लिए किया जा सकता है।
अप्रशिक्षित अधिगम: यह बिना किसी पूर्व ज्ञान के लक्ष्यों के लिए है, जैसे कि समुद्र तल पर नए खोजे गए अज्ञात जैविक समुदाय। क्लस्टरिंग एल्गोरिदम, जैसे कि K-मीन्स क्लस्टरिंग, का उपयोग लक्ष्यों को उनकी विशेषताओं के आधार पर समूहीकृत करने और फिर प्रत्येक समूह के भीतर लक्ष्यों का आगे विश्लेषण करने के लिए किया जा सकता है।
गहन शिक्षण एल्गोरिदम:
कन्वोल्यूशनल न्यूरल नेटवर्क (CNN): यह अंडरवॉटर लक्ष्य पहचान के लिए एक प्रभावी तरीका है। उदाहरण के लिए, कई कन्वोल्यूशनल लेयर्स, पूलिंग लेयर्स और पूरी तरह से कनेक्टेड लेयर्स वाला CNN बनाया जा सकता है। प्रशिक्षण डेटा के रूप में कई अंडरवॉटर इमेज का उपयोग करके, नेटवर्क स्वचालित रूप से लक्ष्य वस्तुओं की उच्च-स्तरीय विशेषताओं को सीख सकता है। उदाहरण के लिए, अंडरवॉटर रोबोट के लिए खनिजों या जहाज़ के मलबे के हिस्सों के रूप में लक्ष्यों को पहचानने में, CNN इन लक्ष्यों की जटिल विशेषताओं को सीख सकता है, जिससे उच्च-सटीक पहचान प्राप्त होती है।
मल्टी-एस फ्यूजन (वैकल्पिक)
सोनार सेंसर के साथ संलयन: पानी के नीचे के वातावरण में, सोनार लक्ष्य वस्तु की दूरी और आकार के बारे में जानकारी प्रदान कर सकता है। पानी के नीचे के कैमरों और सोनार सेंसर से डेटा प्राप्त करके, लक्ष्य वस्तु की अधिक व्यापक समझ हासिल की जा सकती है। उदाहरण के लिए, पानी के नीचे खोज और बचाव कार्यों में, सोनार संभावित मानव लक्ष्य की अनुमानित स्थिति और सीमा का पता लगा सकता है, और फिर पानी के नीचे का कैमरा इस जानकारी का उपयोग सटीक दृश्य पहचान के लिए कर सकता है ताकि यह निर्धारित किया जा सके कि यह लक्ष्य है या नहीं।
ऑप्टिकल सेंसर के साथ फ्यूजन: अगर अंडरवाटर कैमरा मल्टी-स्पेक्ट्रल कैमरा है, तो इसे लक्ष्य पहचान क्षमताओं को बढ़ाने के लिए LiAR जैसे अन्य ऑप्टिकल सेंसर के साथ फ्यूज किया जा सकता है। अलग-अलग ऑप्टिकल सेंसर लक्ष्य वस्तु के बारे में अलग-अलग फीचर जानकारी प्रदान कर सकते हैं, और इस जानकारी को फ्यूज करके, लक्ष्य पहचान की सटीकता और मजबूती में सुधार किया जा सकता है।