ভূমিকা: CMOS-এর আধিপত্যের শেষ আসছে না—এটি এখানে
যখন একটি স্বয়ংচালিত গাড়ি কম আলোতে একটি পথচারী মিস করে বা একটি মাইক্রোস্কোপ বাস্তব সময়ে নিউরাল স্পাইক ট্র্যাক করতে ব্যর্থ হয়, দোষটি কেবল হার্ডওয়্যার সীমাবদ্ধতা নয়—এটি 30 বছরের পুরানো একটি ইমেজিং প্যারাডাইম। ঐতিহ্যবাহী CMOS মডিউল, প্রতিটি ডিজিটাল ক্যামেরার মেরুদণ্ড আজ, এমন একটি বিশ্বে ডিজাইন করা হয় যেখানে "ভাল যথেষ্ট" মানে নির্দিষ্ট সময় অন্তর ফ্রেম ক্যাপচার করা। কিন্তু যখন শিল্পগুলি দ্রুত, স্মার্ট এবং আরও কার্যকর ভিশন সিস্টেমের দাবি করে, CMOS-এর কাঠামোগত বাধাগুলি অতিক্রমযোগ্য হয়ে উঠেছে। প্রবেশ করুন নিউরাল ক্যামেরাগুলিতে: জীববিজ্ঞান দ্বারা অনুপ্রাণিত সেন্সরগুলি যা কেবল আলো রেকর্ড করে না—এটি তা ব্যাখ্যা করে। এটি একটি ধাপে উন্নতি নয়; এটি কিভাবে আমরা ভিজ্যুয়াল ডেটা ক্যাপচার করি তার একটি সম্পূর্ণ পুনঃকল্পনা। 2030 সালের মধ্যে, বিশেষজ্ঞরা পূর্বাভাস দেন যে নিউরাল ক্যামেরাগুলি স্বায়ত্তশাসিত যানবাহন থেকে চিকিৎসা নির্ণয়ের পর্যন্ত উচ্চ-কার্যকারিতা ইমেজিং বাজারের 45% দখল করবে। এখানে কেন—এবং কিভাবে—এগুলি CMOS মডিউলগুলি স্থায়ীভাবে প্রতিস্থাপন করছে। CMOS-এর গোপন ত্রুটি: এটি একটি ভাঙা আপসের উপর নির্মিত
দীর্ঘ কয়েক দশক ধরে, CMOS প্রস্তুতকারকরা দুটি বিপরীত লক্ষ্যকে অনুসরণ করে আসছেন: উচ্চতর রেজোলিউশন এবং দ্রুত ফ্রেম রেট। স্ট্যাকড CMOS (সর্বশেষ সংস্করণ, যা আইফোন 15 প্রো-এর মতো ফ্ল্যাগশিপ ফোনে ব্যবহৃত হয়) TSV (থ্রু সিলিকন ভিয়া) প্রযুক্তির মাধ্যমে এটি সমাধান করার চেষ্টা করেছে, পিক্সেল স্তরগুলোকে লজিক সার্কিট থেকে আলাদা করে ব্যান্ডউইথ বাড়ানোর জন্য। কিন্তু এই ব্যান্ড-এড পদ্ধতিটি নতুন সমস্যার সৃষ্টি করেছে: TSV গুলি তাপীয় চ্যানেল হিসেবে কাজ করে, পিক্সেলের তাপমাত্রা বাড়িয়ে দেয় এবং শব্দ বাড়িয়ে দেয়। আরও খারাপ, স্ট্যাকড CMOS এখনও “ফ্রেম-ভিত্তিক” মডেল অনুসরণ করে—প্রতিটি পিক্সেল একই সময়ের জন্য আলো ধারণ করে, যা গতি এবং সিগন্যাল-টু-নয়েজ অনুপাত (SNR) এর মধ্যে একটি ট্রেডঅফ তৈরি করে।
একজন নিউরোসায়েন্টিস্টের কথা বিবেচনা করুন যিনি মস্তিষ্কের কার্যকলাপ অধ্যয়ন করছেন: মিলিসেকেন্ড স্কেলের ভোল্টেজ স্পাইক ট্র্যাক করতে, তাদের প্রতি সেকেন্ডে 1,000+ ফ্রেমের প্রয়োজন। কিন্তু সেই গতিতে CMOS সেন্সর এত কম আলো ধারণ করে যে সংকেতগুলি শব্দ দ্বারা ডুবে যায়। বিপরীতে, ভাল SNR-এর জন্য দীর্ঘ এক্সপোজার দ্রুতগতির লক্ষ্যগুলিকে অস্পষ্ট করে। এটি CMOS-এ একটি ত্রুটি নয়—এটি এর ডিজাইনের একটি বৈশিষ্ট্য। MIT-এর গবেষক ম্যাথিউ উইলসন যেমন বলেছেন: “CMOS-এর এক আকারে সবকিছু ফিট করার এক্সপোজার একটি মৌলিক সীমাবদ্ধতা যখন আপনি গতিশীল, জটিল দৃশ্যের চিত্রগ্রহণ করার চেষ্টা করছেন।”
অন্যান্য ত্রুটিগুলি আরও গভীরে চলে যায়:
• ডেটা পুনরাবৃত্তি: CMOS প্রতিটি ফ্রেমে প্রতিটি পিক্সেল রেকর্ড করে, এমনকি স্থির পটভূমি, 80% ব্যান্ডউইথ নষ্ট করে।
• গতিশীল পরিসীমার সীমাবদ্ধতা: ঐতিহ্যবাহী CMOS 80–100 dB এ সর্বোচ্চ, উচ্চ-কনট্রাস্ট পরিবেশে ব্যর্থ হয় (যেমন, একটি বনভূমির উপর সূর্যাস্ত)।
• লেটেন্সি: অ্যানালগ লাইট সিগন্যালগুলিকে ডিজিটাল ডেটায় রূপান্তর করা এবং সেগুলি একটি প্রসেসরে পাঠানো বিলম্ব সৃষ্টি করে—স্বায়ত্তশাসিত ড্রাইভিংয়ের মতো অ্যাপ্লিকেশনের জন্য এটি মারাত্মক।
এগুলি এমন সমস্যা নয় যা উন্নত উৎপাদনের মাধ্যমে সমাধান করা যেতে পারে। CMOS তার নিজস্ব স্থাপত্যের শিকার। নিউরাল ক্যামেরাগুলি, বিপরীতে, এই আপসগুলি নির্মূল করার জন্য তৈরি করা হয়েছে।
নিউরাল ক্যামেরা: তিনটি গেম-চেঞ্জিং উদ্ভাবন
নিউরাল ক্যামেরাগুলি মানব রেটিনার থেকে অনুপ্রাণিত, যা শুধুমাত্র তখনই সিগন্যাল ফায়ার করে যখন আলো পরিবর্তিত হয়—কোনও অতিরিক্ত ডেটা নেই, কোনও স্থির এক্সপোজার সময় নেই। এখানে তারা কীভাবে নিয়মগুলি পুনর্লিখন করছে:
1. প্রোগ্রামেবল পিক্সেল: প্রতিটি পিক্সেল তার উদ্দেশ্যের জন্য কাজ করে
সবচেয়ে বড় অগ্রগতি পিক্সেল-স্তরের বুদ্ধিমত্তা থেকে এসেছে। এমআইটির প্রোগ্রামেবল এক্সপোজার সিএমওএস (PE-CMOS) সেন্সর, যা ২০২৪ সালে উন্মোচিত হয়েছে, প্রতিটি পিক্সেলকে স্বাধীনভাবে তার নিজস্ব এক্সপোজার সময় সেট করতে দেয়। প্রতি পিক্সেলে মাত্র ছয়টি ট্রানজিস্টর ব্যবহার করে (পূর্ববর্তী ডিজাইনগুলোর একটি সরলীকরণ), পার্শ্ববর্তী পিক্সেলগুলি একে অপরকে সম্পূরক করতে পারে: দ্রুত এক্সপোজার পিক্সেলগুলি দ্রুত গতির ট্র্যাকিং করে (যেমন, নিউরাল স্পাইক), যখন ধীর এক্সপোজার পিক্সেলগুলি অন্ধকার অঞ্চলে বিস্তারিত ধারণ করে—সবকিছু একই দৃশ্যে।
পরীক্ষায়, PE-CMOS নিউরাল ইমেজিংয়ে একক-স্পাইক রেজোলিউশন অর্জন করেছে, একটি কৃতিত্ব যা সিএমওএস গতি হারানোর ছাড়া মেলাতে পারেনি। “আমরা শুধু আলো ধারণ করছি না—আমরা প্রতিটি পিক্সেল কিভাবে এর সাথে যোগাযোগ করে তা অপ্টিমাইজ করছি,” প্রধান গবেষক জি ঝাং ব্যাখ্যা করেন। এই নমনীয়তা সিএমওএসকে পীড়িত করা গতি-SNR ট্রেডঅফকে নির্মূল করে।
২. ইভেন্ট-চালিত ইমেজিং: যখন এটি গুরুত্বপূর্ণ তখনই ডেটা
ইভেন্ট ক্যামেরা (এক ধরনের নিউরাল ক্যামেরা) এটি আরও এগিয়ে নিয়ে যায়: তারা শুধুমাত্র তখনই ডেটা তৈরি করে যখন একটি পিক্সেল আলোintensity তে পরিবর্তন সনাক্ত করে। ফ্রেমের পরিবর্তে, তারা "ইভেন্ট" আউটপুট করে—সমন্বয়, সময়ের স্ট্যাম্প এবং পোলারিটি (আলো বাড়ছে বা কমছে) সহ তথ্যের ছোট প্যাকেট।
ফলাফলগুলি রূপান্তরকারী:
• 120+ dB গতিশীল পরিসীমা: ইভেন্ট ক্যামেরাগুলি সরাসরি সূর্যালোক এবং অন্ধকার ছায়াগুলিকে একসাথে পরিচালনা করে।
• মাইক্রোসেকেন্ড লেটেন্সি: কোন ফ্রেম বাফার নেই, যার মানে প্রায় তাত্ক্ষণিক ডেটা আউটপুট—স্বয়ংক্রিয় গাড়ির জন্য সংঘর্ষ এড়ানোর জন্য গুরুত্বপূর্ণ।
• 90% কম ডেটা: স্থির দৃশ্যগুলিকে উপেক্ষা করে, ইভেন্ট ক্যামেরাগুলি ব্যান্ডউইথের চাহিদা কমায়, CMOS-এর তুলনায় শক্তি খরচ 70% কমায়।
ভারতীয় বিজ্ঞান ইনস্টিটিউটের গবেষকরা iniVation-এর ইভেন্ট ক্যামেরা ব্যবহার করে 50 ন্যানোমিটারের ছোট ন্যানোপার্টিকেলগুলির চিত্র ধারণ করেছেন—প্রথাগত মাইক্রোস্কোপগুলির বিচ্ছুরণ সীমার বাইরে। ক্যামেরার বিরল ডেটা স্ট্রিম AI অ্যালগরিদমগুলিকে অর্থপূর্ণ সংকেতগুলিতে মনোনিবেশ করতে দেয়, শব্দকে ব্যবহারযোগ্য তথ্যতে রূপান্তরিত করে।
3. অন-সেন্সর AI: প্রক্রিয়াকরণ, শুধু ধারণা নয়
CMOS-এর বিপরীতে, যা চিত্র বিশ্লেষণের জন্য বাহ্যিক প্রসেসরের উপর নির্ভর করে, নিউরাল ক্যামেরাগুলি সেন্সরে AI সরাসরি সংহত করে। স্যামসাংয়ের সর্বশেষ স্ট্যাকড সেন্সরগুলি ইতিমধ্যেই শব্দ হ্রাসের জন্য মৌলিক AI মডিউল অন্তর্ভুক্ত করেছে, কিন্তু নিউরাল ক্যামেরাগুলি এটি নতুন স্তরে নিয়ে যায়: তারা ডেটা ক্যাপচার করার সময় প্রক্রিয়া করে।
যেমন, Prophesee-এর Metavision সেন্সর অন-চিপ নিউরাল নেটওয়ার্ক ব্যবহার করে বাস্তব সময়ে অবজেক্ট সনাক্ত করতে, শুধুমাত্র প্রাসঙ্গিক ডেটা প্রধান প্রসেসরে পাঠায়। শিল্প পরিদর্শনে, এর মানে হল উৎপাদন লাইনে ত্রুটি চিহ্নিত করা বিনা কাজে টেরাবাইটের ফুটেজ সংরক্ষণ না করে। “নিউরাল ক্যামেরাগুলি শুধুমাত্র চিত্র সেন্সর নয়—এগুলি উপলব্ধি ইঞ্জিন,” বলেন চেতন সিং ঠাকুর, ন্যানোটেকনোলজি গবেষণার সহলেখক।
বাস্তব-বিশ্বের প্রতিস্থাপন: যেখানে নিউরাল ক্যামেরাগুলি ইতিমধ্যেই জয়ী হচ্ছে
CMOS থেকে নিউরাল ক্যামেরায় পরিবর্তন তাত্ত্বিক নয়—এটি আজ ঘটছে, উচ্চ-মূল্যের অ্যাপ্লিকেশনগুলি দিয়ে শুরু হচ্ছে যেখানে CMOS-এর ত্রুটিগুলি সবচেয়ে ব্যয়বহুল:
নিউরোসায়েন্স এবং মেডিক্যাল ইমেজিং
MIT-এর PE-CMOS ইতিমধ্যে মুক্তভাবে চলমান প্রাণীদের মধ্যে স্নায়ু কার্যকলাপ ট্র্যাক করতে ব্যবহৃত হচ্ছে, যা CMOS মুছে ফেলা বা শব্দ ছাড়া করতে পারছিল না। এন্ডোস্কোপিতে, ইভেন্ট ক্যামেরার নিম্ন লেটেন্সি এবং উচ্চ গতিশীল পরিসীমা ডাক্তারদের শরীরের ভিতরে দেখতে দেয় কঠোর আলো ছাড়াই, রোগীর অস্বস্তি কমায়।
স্বায়ত্তশাসিত যানবাহন
টেসলা এবং ওয়েমো ইভেন্ট ক্যামেরা এবং CMOS-এর সাথে পরীক্ষা করছে অন্ধ স্থানগুলি নির্মূল করতে এবং প্রতিক্রিয়া সময় কমাতে। একটি স্নায়ু ক্যামেরা একটি শিশুকে রাস্তায় দৌড়াতে 10 গুণ দ্রুত সনাক্ত করতে পারে, সম্ভাব্যভাবে দুর্ঘটনা প্রতিরোধ করতে পারে।
ন্যানোটেকনোলজি ও উপাদান বিজ্ঞান
IISc-এর নিউরোমরফিক মাইক্রোস্কোপ এখন বাণিজ্যিকীকৃত হয়েছে, গবেষকদের অদ্বিতীয় সঠিকতার সাথে আণবিক গতিবিধি অধ্যয়ন করতে দেয়। এটি শুধুমাত্র একটি আপগ্রেড নয়—এটি একটি নতুন সরঞ্জাম যা বৈজ্ঞানিক গবেষণায় সম্ভাবনার পরিধি বাড়ায়।
ভোক্তা ইলেকট্রনিক্স (পরবর্তী স্টপ)
যখন নিউরাল ক্যামেরাগুলি বর্তমানে CMOS এর চেয়ে বেশি ব্যয়বহুল, খরচ কমছে। MIT এর সহজীকৃত পিক্সেল ডিজাইন উৎপাদন জটিলতা কমায়, এবং ভর উৎপাদন ২০২৭ সালের মধ্যে CMOS স্তরের দামে দাম কমিয়ে দেবে। ফ্ল্যাগশিপ ফোনগুলি সম্ভবত প্রথমে হাইব্রিড সিস্টেম গ্রহণ করবে—ভিডিও এবং কম আলোতে নিউরাল ক্যামেরা, স্থির ছবির জন্য CMOS—এরপর ২০৩০ সালের মধ্যে সম্পূর্ণরূপে CMOS প্রতিস্থাপন করবে।
প্রতিস্থাপন পথ: বিবর্তন, বিপ্লব নয়
নিউরাল ক্যামেরাগুলি রাতারাতি CMOS কে প্রতিস্থাপন করবে না। পরিবর্তনটি তিনটি পর্যায় অনুসরণ করবে:
১. পরিপূরক ব্যবহার (২০২৪–২০২৬): নিউরাল ক্যামেরাগুলি উচ্চ-কার্যকারিতা অ্যাপ্লিকেশনগুলিতে CMOS কে বাড়িয়ে তোলে (যেমন, স্বয়ং-চালিত গাড়ি, বৈজ্ঞানিক চিত্রায়ন)।
২. নির্বাচনী প্রতিস্থাপন (২০২৬–২০২৮): খরচ কমার সাথে সাথে, নিউরাল ক্যামেরাগুলি বিশেষায়িত ভোক্তা বাজারে (যেমন, অ্যাকশন ক্যামেরা, ড্রোন ফটোগ্রাফি) দখল করে নেবে যেখানে গতি এবং কম আলোতে কার্যকারিতা সবচেয়ে গুরুত্বপূর্ণ।
3. প্রধানধারার আধিপত্য (২০২৮–২০৩০): নিউরাল ক্যামেরা স্মার্টফোন, ল্যাপটপ এবং আইওটি ডিভাইসে ডিফল্ট হয়ে ওঠে, সিএমওএস বাজেট পণ্যের জন্য সীমাবদ্ধ।
এই পথটি ২০০০-এর দশকে সিসিডি থেকে সিএমওএসে পরিবর্তনের প্রতিফলন—যা কেবল খরচের জন্য নয়, বরং কর্মক্ষমতার দ্বারা চালিত। "সিএমওএস সিসিডিকে প্রতিস্থাপন করেছে কারণ এটি আরও নমনীয় ছিল," শিল্প বিশ্লেষক সারাহ চেন উল্লেখ করেন। "নিউরাল ক্যামেরা সিএমওএসকে একই কারণে প্রতিস্থাপন করছে: এগুলি দৃশ্যের সাথে মানিয়ে নেয়, বিপরীতভাবে নয়।"
অতিক্রম করার চ্যালেঞ্জ
তাদের প্রতিশ্রুতি সত্ত্বেও, নিউরাল ক্যামেরাগুলি বাধার সম্মুখীন হয়:
• শিল্প মান: ইভেন্ট ডেটার জন্য কোন সার্বজনীন প্রোটোকল নেই, যার ফলে সেন্সর এবং সফটওয়্যারের মধ্যে সামঞ্জস্যের সমস্যা হয়।
• কম আলোতে সংবেদনশীলতা: যদিও ইভেন্ট ক্যামেরাগুলি কনট্রাস্টে চমৎকার, তারা এখনও প্রায় সম্পূর্ণ অন্ধকারে সংগ্রাম করে—যদিও এমআইটিতে গবেষণা এটি উন্নত ফটোডায়োডের মাধ্যমে সমাধান করছে।
• ধারণার পক্ষপাত: সেন্সরে এআই সঠিকভাবে প্রশিক্ষিত না হলে পক্ষপাত তৈরি করতে পারে, যা নিরাপত্তা-সংবেদনশীল অ্যাপ্লিকেশনগুলিতে একটি ঝুঁকি।
এই চ্যালেঞ্জগুলি সমাধানযোগ্য। আইইইই-এর মতো কনসোর্টিয়ামগুলি ইভেন্ট ক্যামেরার মান তৈরি করছে, এবং স্টার্টআপগুলি কম আলোতে অপ্টিমাইজেশনে বিনিয়োগ করছে। সবচেয়ে বড় বাধা প্রযুক্তি নয়—এটি মনোভাব: প্রস্তুতকারক এবং ডেভেলপারদের একটি এমন বিশ্বে অভিযোজিত হতে হবে যেখানে ক্যামেরাগুলি শুধু ছবি তোলে না, বরং তারা যা দেখছে তা বুঝতে পারে।
উপসংহার: ইমেজিংয়ের ভবিষ্যৎ নিউরাল
Traditional CMOS মডিউলগুলি ফটোগ্রাফিকে বিপ্লবী করে তুলেছে ডিজিটাল ক্যামেরাগুলিকে সহজলভ্য করে। কিন্তু তারা একটি ফ্রেম-ভিত্তিক মানসিকতায় আটকে আছে যা AI, স্বায়ত্তশাসন এবং বৈজ্ঞানিক আবিষ্কারের চাহিদার সাথে তাল মিলাতে পারছে না। নিউরাল ক্যামেরাগুলি শুধুমাত্র CMOS-এর উন্নতি করে না—তারা একটি ইমেজ সেন্সর কী হতে পারে তা পুনরায় সংজ্ঞায়িত করে।
প্রোগ্রামেবল পিক্সেল, ইভেন্ট-চালিত ডেটা, এবং অন-সেন্সর AI একত্রিত করে, নিউরাল ক্যামেরাগুলি সেই আপসগুলি নির্মূল করে যা দশক ধরে ইমেজিংকে পিছিয়ে রেখেছে। তারা দ্রুত, স্মার্ট এবং আরও কার্যকর, এবং তারা ইতিমধ্যেই সবচেয়ে গুরুত্বপূর্ণ অ্যাপ্লিকেশনগুলিতে CMOS-এর পরিবর্তে আসছে। খরচ কমে আসার এবং প্রযুক্তি পরিণত হওয়ার সাথে সাথে, নিউরাল ক্যামেরাগুলি আজকের CMOS-এর মতো সর্বব্যাপী হয়ে উঠবে—এটি কেবল আমাদের ছবি তোলার পদ্ধতিই নয়, বরং আমাদের বিশ্বের সাথে যোগাযোগের পদ্ধতিও পরিবর্তন করবে।
প্রশ্নটি হল না যে নিউরাল ক্যামেরাগুলি CMOS-কে প্রতিস্থাপন করবে—এটি হল আপনি কত দ্রুত সেগুলি গ্রহণ করবেন। ব্যবসার জন্য, এর উত্তর প্রতিযোগিতার থেকে এগিয়ে থাকার মানে হতে পারে। গ্রাহকদের জন্য, এর মানে হল আরও ভালো ছবি, নিরাপদ গাড়ি, এবং এমন প্রযুক্তি যা আমরা এখনও কল্পনাও করিনি। চিত্রায়নের ভবিষ্যৎ নিউরাল—এবং এটি আপনার ধারণার চেয়ে দ্রুত আসছে।