অপটিক্যাল
ইমেজিং এবং প্রিপ্রসেসিং ইমেজিং নীতি সমন্বয়: জলের নিচে ক্যামেরার অপটিক্যাল সিস্টেম জলের সক্রিয় সূচকের উপর ভিত্তি করে অপ্টিমাইজ করা হয়। পানির প্রতিসরণকারী সূচক আনুমানিক 1.33, যা বাতাসের থেকে ভিন্ন, যা প্রতিসরণ এবং আলোর দিকে পরিচালিত করে। অতএব, তুলনামূলকভাবে পরিষ্কার ছবি নিশ্চিত করতে লেন্স ডিজাইনে এই বিষয়গুলো বিবেচনা করতে হবে। উদাহরণস্বরূপ, বিশেষ ওয়াইড-অ্যাঙ্গেল লেন্স ব্যবহার করে কিছু পরিমাণে ক্রিয়াকলাপের কারণে চিত্রের বিকৃতি কমাতে পারে।
ইমেজ প্রিপ্রসেসিং: জটিল পানির নিচের পরিবেশের কারণে, চিত্রগুলিকে প্রায়শই রঙ সংশোধন করতে এবং বৈসাদৃশ্য বাড়ানোর জন্য প্রি-প্রসেসিংয়ের প্রয়োজন হয়। এর মধ্যে রয়েছে রঙ সংশোধন, জলের দ্বারা শোষিত আলোর নির্দিষ্ট তরঙ্গদৈর্ঘ্যের জন্য ক্ষতিপূরণ এবং বৈপরীত্য বৃদ্ধি, কারণ পানির নিচের ছবিতে সাধারণত কম বৈসাদৃশ্য থাকে। হিস্টোগ্রাম সমীকরণের মতো পদ্ধতিগুলি উন্নত করতে পারে, যার ফলে পটভূমি থেকে লক্ষ্যবস্তুগুলিকে আলাদা করা সহজ হয়।
বৈশিষ্ট্য নিষ্কাশন
আকৃতির বৈশিষ্ট্য: আকৃতি পানির নিচে লক্ষ্য শনাক্তকরণের জন্য একটি গুরুত্বপূর্ণ বৈশিষ্ট্য। কারণ, পানির নিচের প্রত্নতত্ত্বে, প্রাচীন জাহাজের ধ্বংসাবশেষের আকৃতি অনিয়মিত ব্লক বা নির্দিষ্ট জ্যামিতিক আকার থাকতে পারে। এজ ডিটেকশন অ্যালগরিদম, যেমন ক্যানি ডিটেকশন, টার্গেট অবজেক্টের এজ কনট্যুর বের করতে ব্যবহার করা যেতে পারে, যা স্বীকৃতির জন্য গুরুত্বপূর্ণ ক্লু হিসেবে কাজ করে।
টেক্সচারের বৈশিষ্ট্য: অনেক পানির নিচের লক্ষ্যগুলির অনন্য টেক্সচার রয়েছে। উদাহরণস্বরূপ, প্রবাল প্রাচীরগুলির জটিল এবং সূক্ষ্ম টেক্সচার রয়েছে, যখন মাছের স্কেলগুলির নিজস্ব স্বতন্ত্র গঠন রয়েছে। ধূসর-স্তরের সহ-ঘটনার মতো টেক্সচার বিশ্লেষণ পদ্ধতি ব্যবহার করে, আমরা লক্ষ্যবস্তুগুলির টেক্সচার বৈশিষ্ট্যগুলি বের করতে পারি, রুক্ষতা এবং দিকনির্দেশনা সহ, যা স্বীকৃতির জন্য ব্যবহার করা যেতে পারে।
রঙ বৈশিষ্ট্য: যদিও রং বিকৃত করা যেতে পারে, তারা এখনও একটি বৈশিষ্ট্য হিসাবে কিছু পরিমাণে ব্যবহার করা যেতে পারে. উদাহরণস্বরূপ, কিছু গ্রীষ্মমন্ডলীয় মাছ উজ্জ্বল রং আছে। রঙিন হিস্টোগ্রাম বের করে বা রঙ-সংশোধিত চিত্রগুলি থেকে রঙের মুহূর্তগুলি গণনা করে, আমরা স্বীকৃতিতে সহায়তা করার জন্য রঙের বৈশিষ্ট্যগুলি ব্যবহার করতে পারি। উপরন্তু, বিভিন্ন পানির নিচের জীব বা বস্তুর নির্দিষ্ট বর্ণালী ব্যান্ডের অধীনে অনন্য রঙের বৈশিষ্ট্য থাকতে পারে।
টার্গেট রিকগনিশন অ্যালগরিদম
টেমপ্লেট ম্যাচিং-ভিত্তিক অ্যালগরিদম: যদি টার্গেট অবজেক্টের আকৃতির বৈশিষ্ট্যগুলি ভালভাবে সংজ্ঞায়িত করা হয় যেমন পানির নিচের পাইপলাইন পরিদর্শনে যেখানে পাইপলাইনের আকার এবং আকার আগে থেকেই জানা যায়, তাহলে লক্ষ্যবস্তুর টেমপ্লেট চিত্রটি ক্যাপচার করা বস্তুর সাথে মিলিত হতে পারে। ইমেজ সাদৃশ্য পরিমাপ গণনা করে, যেমন স্বাভাবিক ক্রস-সম্পর্ক সহগ, লক্ষ্য বস্তুর অস্তিত্ব এবং অবস্থান নির্ধারণ করা যেতে পারে।
মেশিন লার্নিং অ্যালগরিদম:
তত্ত্বাবধানে শিক্ষা: এর মধ্যে একটি লেবেলযুক্ত আন্ডারওয়াটার ইমেজ ডেটাসেট সহ প্রশিক্ষণ জড়িত। উদাহরণস্বরূপ, যদি বিভিন্ন ধরণের মাছের লেবেলযুক্ত চিত্র থাকে তবে আকৃতির টেক্সচার এবং রঙের মতো বৈশিষ্ট্যগুলি ইনপুট হিসাবে ব্যবহার করা যেতে পারে এবং আউটপুট লেবেল হিসাবে মাছের ধরন ব্যবহার করা যেতে পারে। সাপোর্ট ভেক্টর মেশিন (SVM) এবং সিদ্ধান্ত গাছের মত অ্যালগরিদম শ্রেণীবিভাগ প্রশিক্ষণের জন্য ব্যবহার করা হবে। প্রশিক্ষিত মডেলটি নতুন পানির নিচের ছবিতে মাছের ধরন সনাক্ত করতে ব্যবহার করা যেতে পারে।
তত্ত্বাবধানহীন শিক্ষা: এটি পূর্ব জ্ঞান ছাড়াই লক্ষ্যগুলির জন্য, যেমন সমুদ্রের তলদেশে নতুন আবিষ্কৃত অজানা জৈবিক সম্প্রদায়। ক্লাস্টারিং অ্যালগরিদম, যেমন K- মানে ক্লাস্টারিং, তাদের বৈশিষ্ট্যগুলির উপর ভিত্তি করে গোষ্ঠী লক্ষ্যগুলি ব্যবহার করা যেতে পারে এবং তারপরে প্রতিটি গ্রুপের মধ্যে লক্ষ্যগুলি আরও বিশ্লেষণ করতে পারে।
গভীর শিক্ষার অ্যালগরিদম:
কনভোল্যুশনাল নিউরাল নেটওয়ার্কস (সিএনএন): এটি পানির নিচের টার্গেট চেনার জন্য একটি কার্যকর পদ্ধতি। উদাহরণস্বরূপ, একাধিক কনভোলিউশনাল লেয়ার, পুলিং লেয়ার এবং সম্পূর্ণ সংযুক্ত লেয়ার সহ একটি CNN তৈরি করা যেতে পারে। প্রশিক্ষণ ডেটা হিসাবে পানির নিচের ছবিগুলির একটি সংখ্যা ব্যবহার করে, নেটওয়ার্ক স্বয়ংক্রিয়ভাবে লক্ষ্য বস্তুর উচ্চ-স্তরের বৈশিষ্ট্যগুলি শিখতে পারে। উদাহরণস্বরূপ, একটি জলের নিচের রোবটের লক্ষ্যগুলিকে, খনিজ বা জাহাজের ধ্বংসাবশেষের অংশ হিসাবে চিহ্নিত করার ক্ষেত্রে, সিএনএন এই লক্ষ্যগুলির জটিল বৈশিষ্ট্যগুলি শিখতে পারে, যার ফলে উচ্চ-নির্ভুলতা স্বীকৃতি অর্জন করা যায়।
মাল্টি-এস ফিউশন (ঐচ্ছিক)
সোনার সেন্সরগুলির সাথে ফিউশন: পানির নিচের পরিবেশে, সোনার লক্ষ্য বস্তুর দূরত্ব এবং আকার সম্পর্কে তথ্য সরবরাহ করতে পারে। পানির নিচের ক্যামেরা এবং সোনার সেন্সর থেকে পাওয়া তথ্যের মাধ্যমে লক্ষ্যবস্তু সম্পর্কে আরও ব্যাপক ধারণা অর্জন করা যায়। উদাহরণস্বরূপ, পানির নিচে অনুসন্ধান এবং উদ্ধার অভিযানে,এআর একটি সম্ভাব্য মানব লক্ষ্যের আনুমানিক অবস্থান এবং পরিসর সনাক্ত করতে পারে এবং তারপরে পানির নিচের ক্যামেরাটি লক্ষ্য কিনা তা নির্ধারণ করতে সুনির্দিষ্ট ভিজ্যুয়াল স্বীকৃতির জন্য এই তথ্যটি ব্যবহার করতে পারে।
অপটিক্যাল সেন্সরগুলির সাথে ফিউশন: পানির নিচের ক্যামেরাটি যদি একটি মাল্টি-স্পেকট্রাল ক্যামেরা হয়, তবে লক্ষ্য শনাক্তকরণ ক্ষমতা বাড়ানোর জন্য এটি LiAR-এর মতো অন্যান্য অপটিক্যাল সেন্সরগুলির সাথে ফিউজ করা যেতে পারে। বিভিন্ন অপটিক্যাল সেন্সর টার্গেট অবজেক্ট সম্পর্কে বিভিন্ন বৈশিষ্ট্যের তথ্য প্রদান করতে পারে এবং এই তথ্যগুলিকে ফিউজ করে, লক্ষ্য শনাক্তকরণের নির্ভুলতা এবং দৃঢ়তা উন্নত করা যেতে পারে।