অগমেন্টেড রিয়েলিটি (এআর) প্রযুক্তির বিকাশে, গভীরতা উপলব্ধির নির্ভুলতা সরাসরি ভার্চুয়াল বস্তুর বাস্তব দৃশ্যের সাথে একীকরণের প্রভাবকে প্রভাবিত করে। TOF (টাইম অফ ফ্লাইট ক্যামেরা মডিউল), রিয়েল টাইমে ত্রিমাত্রিক স্থানিক ডেটা অর্জনের ক্ষমতা সহ, AR ডিভাইসের মূল উপাদান হয়ে উঠেছে। তবে, জটিল পরিবেশে এর গভীরতা উপলব্ধির নির্ভুলতা কীভাবে আরও উন্নত করা যায় তা এখনও শিল্পের কেন্দ্রবিন্দু। এই নিবন্ধে TOF-এর গভীরতা উপলব্ধির নির্ভুলতা উন্নতি প্রকল্প নিয়ে আলোচনা করা হবে।
ক্যামেরা মডিউল তিনটি মাত্রা থেকে AR অ্যাপ্লিকেশনগুলিতে: প্রযুক্তিগত অপ্টিমাইজেশন, নকশা এবং মাল্টি-সেন্সর ফিউশন।
১. অ্যালগরিদম অপ্টিমাইজেশন: শব্দ দমন থেকে গভীর সংযোজন পর্যন্ত
ঐতিহ্যবাহী TOF সেন্সরগুলি শব্দের গভীরতার তথ্যে, পরিবেষ্টিত আলোর হস্তক্ষেপের ঝুঁকিতে থাকে। Meizu 17 Pro-এর জন্য Ouster দ্বারা কাস্টমাইজ করা সমাধানটি উচ্চ-কার্যক্ষমতা সম্পন্ন ফিল্টারিং অ্যালগরিদম ব্যবহার করে, যা অভিযোজিত শব্দ দমন প্রযুক্তির মাধ্যমে, উচ্চ নিম্ন-ফ্রিকোয়েন্সি শব্দকে বিশেষভাবে দূর করে, গভীরতার মানচিত্রের স্বচ্ছতা উল্লেখযোগ্যভাবে উন্নত করে। এছাড়াও, Qualcomm DSP দ্বারা অপ্টিমাইজ করা গভীরতার ইঞ্জিনের সাথে মিলিত হয়ে, সিস্টেমের বিদ্যুৎ খরচ 15% হ্রাস পায়, একই সাথে 30FPS এর স্থিতিশীল ফ্রেম রেট বজায় রাখে, AR অ্যাপ্লিকেশনগুলির সাবলীলতা নিশ্চিত করে।
অপর্যাপ্ত To রেজোলিউশনের সমস্যা পূরণের জন্য, ঝেজিয়াং বিশ্ববিদ্যালয়ের দল দ্বারা তৈরি DELTAR ফ্রেমওয়ার্কটি গভীর শিক্ষার মাধ্যমে হালকা ToF এবং RGB চিত্রের সংমিশ্রণ অর্জন করে। এই স্কিমটি ToF এর গভীরতার তথ্যের পরিপূরক হিসাবে RGB এর টেক্সচার বিবরণ ব্যবহার করে। ECCV 2022 পরীক্ষায়, ঐতিহ্যবাহী পদ্ধতির তুলনায় এর গভীরতা অনুমান ত্রুটি 23% হ্রাস পেয়েছে এবং এর গণনা দক্ষতা 40% বৃদ্ধি পেয়েছে, যা এটিকে মোবাইল টার্মিনালের মতো সম্পদ-সীমাবদ্ধ ডিভাইসের জন্য উপযুক্ত করে তুলেছে।
2. হার্ডওয়্যার ডিজাইন: মডুলারাইজেশন এবং পাওয়ার ইন্টিগ্রেশন
হার্ডওয়্যার-স্তরের উদ্ভাবন হল নির্ভুলতা উন্নতির ভিত্তি। Ouster-এর Femto-W মডিউল iToF প্রযুক্তি ব্যবহার করে 0.2-2.5 মিটারের মধ্যে মিলিমিটার-নির্ভুলতা অর্জন করে, একটি গভীরতা কম্পিউটিং পাওয়ার প্ল্যাটফর্মকে একীভূত করে এবং বহিরাগত কম্পিউটিং পাওয়ার সাপোর্টের প্রয়োজন হয় না। এর অতি-প্রশস্ত-নকশা (120° দৃশ্যের ক্ষেত্র) বিস্তৃত স্থানিক তথ্য ক্যাপচার করতে পারে এবং ইনফ্রারেড এবং গভীরতা ডেটার Y16 ফর্ম্যাট আউটপুট দৃশ্য মডেলিংয়ের জন্য উচ্চ-বিশ্বস্ততা ডেটা সরবরাহ করে।
ব্যাপক উৎপাদনের চাহিদার জন্য, মডিউলটি হার্ডওয়্যার নির্বাচনের সময় উৎপাদন লাইনে ক্রমাঙ্কনের দক্ষতা বিবেচনা করে, ওয়ান-স্টপ ক্যালিব্রেশন প্রযুক্তির মাধ্যমে ফলন উন্নত করে এবং 3D মুখ স্বীকৃতি, SLAM ইত্যাদির মতো জটিল ফাংশনগুলি ব্যবহার করে, যা ভোক্তা ইলেকট্রনিক্স এবং শিল্প অটোমেশন পরিস্থিতির দ্বৈত চাহিদা পূরণ করে।
৩. মাল্টি-সেন্সর ফিউশন: একটি ত্রিমাত্রিক উপলব্ধি ব্যবস্থা প্রতিষ্ঠা করা
মনো ToF সেন্সরগুলির এখনও জটিল আলো বা নিম্ন-টেক্সচারের পরিস্থিতির সীমাবদ্ধতা রয়েছে। RGB এবং IMU-এর মতো মাল্টি-মডেল ডেটা একীভূত করে, আরও সম্পূর্ণ গভীরতা উপলব্ধি ব্যবস্থা তৈরি করা যেতে পারে। উদাহরণস্বরূপ, Meizu 18 Pro-এর AR রুলার ফাংশন সেন্টিমিটার-স্তরের দূরত্ব পরিমাপের নির্ভুলতা অর্জনের জন্য ToF গভীরতা ডেটাকে IMU মনোভাবের তথ্যের সাথে একত্রিত করে। DELTAR ফ্রেমওয়ার্ক, বৈশিষ্ট্য সারিবদ্ধকরণ অ্যালগরিদম, ToF গভীরতা মানচিত্র এবং RGB চিত্রের পিক্সেল-স্তরের নিবন্ধন, প্যারালাক্স ত্রুটিগুলি দূর করে এবং ভার্চুয়াল বস্তুর স্থানিক অবস্থান নির্ভুলতা উন্নত করে।
গতিশীল দৃশ্যের পাশাপাশি, মাল্টি-সেন্সর ফিউশন কার্যকরভাবে গতি ঝাপসা হওয়ার সমস্যা সমাধান করতে পারে। ToF এবং RGB ডেটা সিঙ্ক্রোনাসভাবে সংগ্রহ করে এবং সময় ক্রম অপ্টিমাইজেশন অ্যালগরিদমকে একত্রিত করে, সিস্টেমটি রিয়েল-টাইম গতির কারণে সৃষ্ট গভীরতা বিচ্যুতি সংশোধন করে, AR মিথস্ক্রিয়ার স্থিতিশীলতা নিশ্চিত করে।
৪. প্রয়োগ অনুশীলন এবং ভবিষ্যতের প্রবণতা
বর্তমানে, ToF লেন্স মডিউলগুলি মোবাইল ফোন AR-তে যুগান্তকারী অ্যাপ্লিকেশন অর্জন করেছে। Meizu 17 Pro-এর ভিডিও রিয়েল-টাইম ব্লারিং ফাংশন, ToF ডেপথ ইঞ্জিনের মাধ্যমে, ব্যাকগ্রাউন্ড এবং সাবজেক্টের মধ্যে সুনির্দিষ্ট বিচ্ছেদ উপলব্ধি করে এবং ব্লারিংয়ের রূপান্তর আরও স্বাভাবিক; Orbbec for 18 Pro-এর কাস্টমাইজড সলিউশন AR ভিশনের মতো উদ্ভাবনী ফাংশনগুলিকে সমর্থন করে, যা কম আলোর পরিবেশে AR-এর অ্যাপ্লিকেশন সীমানা প্রসারিত করে। ভবিষ্যতে, হালকা অ্যালগরিদম এবং কম-পাওয়ার হার্ডওয়্যারের বিকাশের সাথে, ToF মডিউলগুলি ছোট আকার এবং কম খরচে বিকশিত হবে, যা স্মার্ট হোম, শিল্প পরিদর্শন এবং অন্যান্য ক্ষেত্রে AR প্রযুক্তির জনপ্রিয়তাকে উৎসাহিত করবে।
অ্যালগরিদম অপ্টিমাইজেশন, হার্ডওয়্যার উদ্ভাবন এবং মাল্টি-মডাল ফিউশনের সমন্বিত বিকাশের উপর নির্ভর করার জন্য ToF লেন্স মডিউলের গভীরতা উপলব্ধি নির্ভুলতার উন্নতি। প্রযুক্তিগত বাধাগুলির ক্রমাগত অগ্রগতির মাধ্যমে, ToF ডিভাইসগুলির জন্য "ভার্চুয়াল এবং বাস্তবের নিরবচ্ছিন্ন একীকরণ" অর্জনের মূল চালিকা শক্তি হয়ে উঠবে, যা ব্যবহারকারীদের আরও নিমজ্জিত এবং আরও নির্ভুল ইন্টারেক্টিভ অভিজ্ঞতা প্রদান করবে।