परिचय: CMOS के प्रभुत्व का अंत आ रहा है—यह यहाँ है
जब एक स्व-चालित कार कम रोशनी में एक पैदल यात्री को चूक जाती है या एक सूक्ष्मदर्शी वास्तविक समय में न्यूरल स्पाइक्स को ट्रैक करने में विफल रहता है, तो दोष केवल हार्डवेयर सीमाएँ नहीं हैं—यह 30 साल पुराना इमेजिंग पैरेडाइम है। पारंपरिकCMOS मॉड्यूल, हर डिजिटल कैमरा की रीढ़, एक ऐसी दुनिया के लिए डिज़ाइन किए गए थे जहाँ "पर्याप्त अच्छा" का मतलब था निश्चित अंतराल पर फ़्रेम कैप्चर करना। लेकिन जैसे-जैसे उद्योग तेज़, स्मार्ट, और अधिक कुशल दृष्टि प्रणालियों की मांग कर रहे हैं, CMOS की संरचनात्मक बाधाएँ अजेय हो गई हैं। न्यूरल कैमरों में प्रवेश करें: जैव-प्रेरित सेंसर जो केवल प्रकाश को रिकॉर्ड नहीं करते—वे इसे व्याख्या करते हैं। यह एक क्रमिक उन्नयन नहीं है; यह हमारे दृश्य डेटा को कैप्चर करने के तरीके का एक पूरा पुनःकल्पना है। 2030 तक, विशेषज्ञों का अनुमान है कि न्यूरल कैमरे उच्च-प्रदर्शन इमेजिंग बाजारों का 45% हिस्सा बनाएंगे, स्वायत्त वाहनों से लेकर चिकित्सा निदान तक। यहाँ यह है कि क्यों—और कैसे—वे CMOS मॉड्यूल को स्थायी रूप से बदल रहे हैं। CMOS में छिपी खामी: यह एक टूटे हुए समझौते पर आधारित है
दशकों से, CMOS निर्माता दो विरोधाभासी लक्ष्यों का पीछा कर रहे हैं: उच्च रिज़ॉल्यूशन और तेज़ फ़्रेम दरें। स्टैक्ड CMOS (नवीनतम संस्करण, जो iPhone 15 Pro जैसे प्रमुख फोन में उपयोग किया जाता है) ने TSV (थ्रू सिलिकॉन विया) तकनीक के साथ इसे हल करने का प्रयास किया, जो पिक्सेल परतों को लॉजिक सर्किट से अलग करता है ताकि बैंडविड्थ बढ़ सके। लेकिन इस बैंड-एड दृष्टिकोण ने नई समस्याएँ उत्पन्न कीं: TSVs थर्मल चैनलों के रूप में कार्य करते हैं, पिक्सेल तापमान को बढ़ाते हैं और शोर को बढ़ाते हैं। इससे भी बदतर, स्टैक्ड CMOS अभी भी "फ्रेम-आधारित" मॉडल का पालन करता है—हर पिक्सेल एक ही अवधि के लिए प्रकाश को कैप्चर करता है, जिससे गति और सिग्नल-टू-नॉइज़ अनुपात (SNR) के बीच एक व्यापारिक समझौता होता है।
एक न्यूरोसाइंटिस्ट को मस्तिष्क की गतिविधि का अध्ययन करते हुए विचार करें: मिलीसेकंड-स्केल वोल्टेज स्पाइक्स को ट्रैक करने के लिए, उन्हें प्रति सेकंड 1,000+ फ्रेम की आवश्यकता होती है। लेकिन उस गति पर CMOS सेंसर इतनी कम रोशनी कैप्चर करते हैं कि सिग्नल शोर द्वारा डूब जाते हैं। इसके विपरीत, बेहतर SNR के लिए लंबे एक्सपोजर तेज़ गति वाले लक्ष्यों को धुंधला कर देते हैं। यह CMOS में एक बग नहीं है—यह इसके डिज़ाइन की एक विशेषता है। जैसे MIT के शोधकर्ता मैथ्यू विल्सन कहते हैं: “CMOS का एक आकार सभी के लिए उपयुक्त एक्सपोजर गतिशील, जटिल दृश्यों की छवि बनाने की कोशिश करते समय एक मौलिक सीमा है।”
अन्य खामियाँ गहरी हैं:
• डेटा पुनरावृत्ति: CMOS हर फ्रेम में हर पिक्सेल को रिकॉर्ड करता है, यहां तक कि स्थिर पृष्ठभूमियों को, 80% बैंडविड्थ बर्बाद करता है।
• गतिशील रेंज सीमाएँ: पारंपरिक CMOS 80–100 dB पर शीर्ष पर पहुँचता है, उच्च-प्रतिविरोधी वातावरण (जैसे, एक जंगल के ऊपर सूर्यास्त) में विफल रहता है।
• लेटेंसी: एनालॉग लाइट सिग्नल को डिजिटल डेटा में परिवर्तित करना और उन्हें प्रोसेसर को भेजना देरी उत्पन्न करता है—स्वायत्त ड्राइविंग जैसी अनुप्रयोगों के लिए घातक।
ये ऐसे मुद्दे नहीं हैं जिन्हें बेहतर निर्माण से ठीक किया जा सके। CMOS अपनी ही आर्किटेक्चर का शिकार है। इसके विपरीत, न्यूरल कैमरे इन समझौतों को समाप्त करने के लिए बनाए गए हैं।
न्यूरल कैमरे: तीन गेम-चेंजिंग नवाचार
न्यूरल कैमरे मानव रेटिना से प्रेरणा लेते हैं, जो केवल तब सिग्नल भेजता है जब प्रकाश बदलता है—कोई अतिरिक्त डेटा नहीं, कोई निश्चित एक्सपोजर समय नहीं। यहाँ बताया गया है कि वे नियमों को कैसे फिर से लिख रहे हैं:
1. प्रोग्रामेबल पिक्सल: प्रत्येक पिक्सल अपने उद्देश्य के लिए काम करता है
सबसे बड़ा ब्रेकथ्रू पिक्सेल-स्तरीय बुद्धिमत्ता से आता है। MIT का प्रोग्रामेबल एक्सपोजर CMOS (PE-CMOS) सेंसर, जो 2024 में पेश किया गया, हर पिक्सेल को स्वतंत्र रूप से अपनी एक्सपोजर टाइम सेट करने की अनुमति देता है। सिर्फ छह ट्रांजिस्टर प्रति पिक्सेल (पहले के डिज़ाइन का सरलीकरण) का उपयोग करते हुए, पड़ोसी पिक्सेल एक-दूसरे को पूरा कर सकते हैं: तेज़ एक्सपोजर पिक्सेल तेज गति (जैसे, न्यूरल स्पाइक्स) को ट्रैक करते हैं, जबकि धीमे एक्सपोजर पिक्सेल अंधेरे क्षेत्रों में विवरण कैप्चर करते हैं—सभी एक ही दृश्य में।
परीक्षणों में, PE-CMOS ने न्यूरल इमेजिंग में सिंगल-स्पाइक रिज़ॉल्यूशन हासिल किया, जो CMOS बिना गति का बलिदान किए मेल नहीं खा सका। “हम सिर्फ प्रकाश को कैप्चर नहीं कर रहे हैं—हम यह अनुकूलित कर रहे हैं कि प्रत्येक पिक्सेल इसके साथ कैसे इंटरैक्ट करता है,” मुख्य शोधकर्ता जिए झांग बताते हैं। यह लचीलापन CMOS को परेशान करने वाले गति-SNR ट्रेडऑफ को समाप्त करता है।
2. इवेंट-ड्रिवन इमेजिंग: डेटा केवल तब जब यह महत्वपूर्ण हो
इवेंट कैमरे (एक प्रकार का न्यूरल कैमरा) इसे और आगे बढ़ाते हैं: वे केवल तब डेटा उत्पन्न करते हैं जब एक पिक्सेल प्रकाश तीव्रता में परिवर्तन का पता लगाता है। फ्रेम के बजाय, वे "इवेंट" आउटपुट करते हैं—जानकारी के छोटे पैकेट जिनमें समन्वय, समय मुहर, और ध्रुवता (प्रकाश बढ़ना या घटना) होता है।
परिणाम परिवर्तनकारी हैं:
• 120+ dB डायनामिक रेंज: इवेंट कैमरे सीधे धूप और गहरे साए को एक साथ संभालते हैं।
• माइक्रोसेकंड लेटेंसी: कोई फ्रेम बफर नहीं होने का मतलब है लगभग तात्कालिक डेटा आउटपुट—स्वायत्त वाहनों के लिए टकराव से बचने के लिए महत्वपूर्ण।
• 90% कम डेटा: स्थिर दृश्यों की अनदेखी करके, इवेंट कैमरे बैंडविड्थ की मांग को कम करते हैं, CMOS की तुलना में बिजली की खपत को 70% तक कम करते हैं।
भारतीय विज्ञान संस्थान के शोधकर्ताओं ने 50 नैनोमीटर से छोटे नैनोपार्टिकल्स की इमेजिंग के लिए iniVation के इवेंट कैमरे का उपयोग किया—जो पारंपरिक माइक्रोस्कोप के विवर्तन सीमा से परे है। कैमरे काSparse डेटा स्ट्रीम AI एल्गोरिदम को महत्वपूर्ण संकेतों पर ध्यान केंद्रित करने की अनुमति देती है, शोर को उपयोगी जानकारी में बदल देती है।
3. ऑन-सेंसर AI: प्रोसेसिंग, केवल कैप्चरिंग नहीं
CMOS के विपरीत, जो छवियों का विश्लेषण करने के लिए बाहरी प्रोसेसर पर निर्भर करता है, न्यूरल कैमरे AI को सीधे सेंसर में एकीकृत करते हैं। सैमसंग के नवीनतम स्टैक्ड सेंसर पहले से ही शोर कम करने के लिए बुनियादी AI मॉड्यूल शामिल करते हैं, लेकिन न्यूरल कैमरे इसे एक नए स्तर पर ले जाते हैं: वे डेटा को कैप्चर करते समय प्रोसेस करते हैं।
उदाहरण के लिए, Prophesee का Metavision सेंसर ऑन-चिप न्यूरल नेटवर्क का उपयोग करके वास्तविक समय में वस्तुओं का पता लगाता है, केवल प्रासंगिक डेटा को मुख्य प्रोसेसर को भेजता है। औद्योगिक निरीक्षण में, इसका मतलब है उत्पादन लाइन पर दोषों की पहचान करना बिना टेराबाइट्स बेकार फुटेज को स्टोर किए। "न्यूरल कैमरे केवल छवि सेंसर नहीं हैं—वे धारणा इंजन हैं," कहते हैं चेतन सिंह ठाकुर, नैनोटेक्नोलॉजी अध्ययन के सह-लेखक।
वास्तविक दुनिया में प्रतिस्थापन: जहां न्यूरल कैमरे पहले से ही जीत रहे हैं
CMOS से न्यूरल कैमरों में बदलाव सिद्धांतात्मक नहीं है—यह आज हो रहा है, उच्च मूल्य वाले अनुप्रयोगों से शुरू हो रहा है जहां CMOS की खामियां सबसे महंगी हैं:
तंत्रिका विज्ञान और चिकित्सा इमेजिंग
MIT का PE-CMOS पहले से ही स्वतंत्र रूप से चलने वाले जानवरों में न्यूरल गतिविधि को ट्रैक करने के लिए उपयोग किया जा रहा है, जो कि CMOS बिना धुंधलापन या शोर के नहीं कर सकता था। एंडोस्कोपी में, इवेंट कैमरों की कम विलंबता और उच्च गतिशील रेंज डॉक्टरों को शरीर के अंदर देखने की अनुमति देती है बिना कठोर रोशनी के, जिससे रोगी की असुविधा कम होती है।
स्वायत्त वाहन
टेस्ला और वेमो इवेंट कैमरों का परीक्षण CMOS के साथ कर रहे हैं ताकि अंधे स्थानों को समाप्त किया जा सके और प्रतिक्रिया समय को कम किया जा सके। एक न्यूरल कैमरा सड़क पर दौड़ते हुए बच्चे का पता CMOS की तुलना में 10 गुना तेजी से लगा सकता है, संभावित रूप से दुर्घटनाओं को रोक सकता है।
नैनोटेक्नोलॉजी और सामग्री विज्ञान
IISc का न्यूरोमोर्फिक माइक्रोस्कोप अब वाणिज्यिकृत हो चुका है, जिससे शोधकर्ता अभूतपूर्व सटीकता के साथ आणविक गति का अध्ययन कर सकते हैं। यह केवल एक उन्नयन नहीं है—यह एक नया उपकरण है जो वैज्ञानिक अनुसंधान में संभावनाओं का विस्तार करता है।
उपभोक्ता इलेक्ट्रॉनिक्स (अगला पड़ाव)
हालांकि न्यूरल कैमरे वर्तमान में CMOS से अधिक महंगे हैं, लागत गिर रही है। MIT की सरल पिक्सेल डिज़ाइन उत्पादन जटिलता को कम करती है, और बड़े पैमाने पर उत्पादन कीमतों को 2027 तक CMOS स्तरों तक लाएगा। प्रमुख फोन पहले हाइब्रिड सिस्टम अपनाएंगे—वीडियो और कम रोशनी के लिए न्यूरल कैमरे, स्थिर चित्रों के लिए CMOS—2030 तक CMOS को पूरी तरह से बदलने से पहले।
प्रतिस्थापन पथ: विकास, क्रांति नहीं
न्यूरल कैमरे रातोंरात CMOS को प्रतिस्थापित नहीं करेंगे। संक्रमण तीन चरणों का पालन करेगा:
1. पूरक उपयोग (2024–2026): न्यूरल कैमरे उच्च प्रदर्शन अनुप्रयोगों में CMOS को बढ़ाते हैं (जैसे, स्व-ड्राइविंग कारें, वैज्ञानिक इमेजिंग)।
2. चयनात्मक प्रतिस्थापन (2026–2028): जैसे-जैसे लागत गिरती है, न्यूरल कैमरे विशेष उपभोक्ता बाजारों (जैसे, एक्शन कैमरे, ड्रोन फोटोग्राफी) पर कब्जा कर लेते हैं जहाँ गति और कम रोशनी का प्रदर्शन सबसे महत्वपूर्ण होता है।
3. मुख्यधारा का प्रभुत्व (2028–2030): न्यूरल कैमरे स्मार्टफोन्स, लैपटॉप और IoT उपकरणों में डिफ़ॉल्ट बन जाते हैं, जबकि CMOS बजट उत्पादों तक सीमित रहता है।
यह मार्ग 2000 के दशक में CCD से CMOS में बदलाव को दर्शाता है—जो प्रदर्शन द्वारा संचालित था, केवल लागत से नहीं। "CMOS ने CCD को इसलिए प्रतिस्थापित किया क्योंकि यह अधिक लचीला था," उद्योग विश्लेषक सारा चेन नोट करती हैं। "न्यूरल कैमरे CMOS को उसी कारण से प्रतिस्थापित कर रहे हैं: वे दृश्य के अनुसार अनुकूलित होते हैं, न कि इसके विपरीत।"
पार करने के लिए चुनौतियाँ
उनकी वादों के बावजूद, न्यूरल कैमरों को बाधाओं का सामना करना पड़ता है:
• उद्योग मानक: इवेंट डेटा के लिए कोई सार्वभौमिक प्रोटोकॉल नहीं होने के कारण सेंसर और सॉफ़्टवेयर के बीच संगतता की समस्याएँ हैं।
• कम रोशनी की संवेदनशीलता: जबकि इवेंट कैमरे कंट्रास्ट में उत्कृष्ट हैं, वे फिर भी लगभग पूर्ण अंधकार में संघर्ष करते हैं—हालांकि एमआईटी में अनुसंधान इसे बेहतर फोटोडायोड के साथ संबोधित कर रहा है।
• धारणा पूर्वाग्रह: यदि ठीक से प्रशिक्षित नहीं किया गया तो सेंसर पर एआई पूर्वाग्रह पैदा कर सकता है, जो सुरक्षा-क्रिटिकल अनुप्रयोगों में एक जोखिम है।
ये चुनौतियाँ हल करने योग्य हैं। IEEE जैसे संघ इवेंट कैमरा मानकों का विकास कर रहे हैं, और स्टार्टअप कम रोशनी के अनुकूलन में निवेश कर रहे हैं। सबसे बड़ी बाधा तकनीक नहीं है—यह मानसिकता है: निर्माताओं और डेवलपर्स को एक ऐसी दुनिया में अनुकूलित करने की आवश्यकता है जहाँ कैमरे केवल तस्वीरें नहीं लेते, बल्कि वे जो देख रहे हैं उसे समझते हैं।
निष्कर्ष: इमेजिंग का भविष्य न्यूरल है
पारंपरिक CMOS मॉड्यूल ने डिजिटल कैमरों को सुलभ बनाकर फोटोग्राफी में क्रांति ला दी। लेकिन वे एक फ्रेम-आधारित मानसिकता में फंसे हुए हैं जो AI, स्वायत्तता, और वैज्ञानिक खोज की मांगों के साथ नहीं चल सकते। न्यूरल कैमरे केवल CMOS में सुधार नहीं करते—वे यह परिभाषित करते हैं कि एक इमेज सेंसर क्या हो सकता है।
प्रोग्रामेबल पिक्सल, इवेंट-ड्रिवन डेटा, और ऑन-सेंसर AI को मिलाकर, न्यूरल कैमरे उन समझौतों को समाप्त करते हैं जो दशकों से इमेजिंग को पीछे रखे हुए थे। वे तेज, स्मार्ट, और अधिक कुशल हैं, और वे पहले से ही उन अनुप्रयोगों में CMOS को बदल रहे हैं जो सबसे महत्वपूर्ण हैं। जैसे-जैसे लागत घटती है और तकनीक परिपक्व होती है, न्यूरल कैमरे CMOS की तरह सर्वव्यापी हो जाएंगे—यह न केवल यह बदल देगा कि हम तस्वीरें कैसे लेते हैं, बल्कि यह भी कि हम दुनिया के साथ कैसे इंटरैक्ट करते हैं।
सवाल यह नहीं है कि न्यूरल कैमरे CMOS को बदल देंगे—यह है कि आप उन्हें कितनी जल्दी अपनाएंगे। व्यवसायों के लिए, इसका उत्तर प्रतिस्पर्धा से आगे रहने का मतलब हो सकता है। उपभोक्ताओं के लिए, इसका मतलब है बेहतर फोटो, सुरक्षित कारें, और ऐसी तकनीकें जो हमने अभी तक कल्पना भी नहीं की हैं। इमेजिंग का भविष्य न्यूरल है—और यह आपसे तेज़ी से आ रहा है।