ஒரு ஸ்மார்ட் ரீடெய்ல் ஸ்டோருக்குள் நுழையுங்கள், ஒரு AI கேமரா மாட்யூல் வாடிக்கையாளர் நகர்வுகளைக் கண்காணித்து, ஷெல்ஃப் காட்சிகளை மேம்படுத்துகிறது. ஒரு நவீன காரை ஓட்டுங்கள், அது பாதசாரிகளைக் கண்டறிந்து மோதல்களைத் தடுக்க அதே தொழில்நுட்பத்தைப் பயன்படுத்துகிறது. உங்கள் ஸ்மார்ட்போனின் போர்ட்ரெய்ட் மோடைச் சரிபார்க்கவும் - பின்னணியை மங்கலாக்கவும், விஷயங்களை முன்னிலைப்படுத்தவும் நீங்கள் ஒரு AI கேமரா மாட்யூலை நம்பியிருக்கிறீர்கள். இந்த சிறிய, சக்திவாய்ந்த கூறுகள், பாரம்பரிய கேமராக்களின் செயலற்ற வீடியோ பதிவுகளுக்கு அப்பால் சென்று, இயந்திரங்கள் உலகை "பார்க்கும்" விதத்தை அமைதியாக மாற்றியுள்ளன. ஆனால் AI கேமரா மாட்யூல் என்றால் என்ன, அது காட்சித் தரவைச் செயல்படக்கூடிய நுண்ணறிவாக எவ்வாறு மாற்றுகிறது?
பெரும்பாலானோர் குழப்பமடைகிறார்கள் AI கேமரா தொகுதிகள் வழக்கமான கேமரா தொகுதிகள், அவை "கூடுதல் அம்சங்கள் கொண்ட கேமராக்கள்" என்று கருதப்படுகின்றன. உண்மை மிகவும் மாற்றத்தக்கது: ஒரு AI கேமரா தொகுதி என்பது படங்களைப் பிடிப்பதற்கான ஒரு கருவி மட்டுமல்ல - இது வன்பொருள், மென்பொருள் மற்றும் மேம்பட்ட வழிமுறைகளை ஒருங்கிணைத்து, காட்சித் தரவை நிகழ்நேரத்தில் புரிந்துகொள்ளும் ஒரு "எட்ஜ் இன்டெலிஜென்ஸ் டெர்மினல்" ஆகும். ஒளியை டிஜிட்டல் சிக்னல்களாக மாற்றும் பாரம்பரிய கேமரா தொகுதிகளைப் போலல்லாமல், AI கேமரா தொகுதிகள் அவை "பார்க்கும்" விஷயங்களின் அடிப்படையில் பகுப்பாய்வு செய்யவும், விளக்கவும், முடிவுகளை எடுக்கவும் முடியும் - இவை அனைத்தும் ஒவ்வொரு பணிக்கும் தொலைதூர கிளவுட் சர்வரைச் சார்ந்து இருக்க வேண்டிய அவசியமில்லை. இந்த வலைப்பதிவில், நாங்கள் AI கேமரா மாட்யூல்களை விளக்குவோம்: அவற்றின் அடிப்படை கூறுகள், அவை எவ்வாறு படி படியாக செயல்படுகின்றன, அவற்றை தனித்துவமாக்கும் புதுமையான தொழில்நுட்பங்கள், மற்றும் அவை ஏன் தொழில்களில் அவசியமாக மாறுகின்றன. நீங்கள் புத்திசாலி பாதுகாப்பை ஏற்க விரும்பும் வணிக உரிமையாளர், ஸ்மார்ட்போன் புகைப்படக் கலை பற்றி ஆர்வமுள்ள தொழில்நுட்ப ஆர்வலர், அல்லது எம்பெடிட் செய்யப்பட்ட AI-ஐ ஆராயும் டெவலப்பர் என்றால், இந்த வழிகாட்டி சிக்கலான கருத்துக்களை எளிமையான, செயல்படுத்தக்கூடிய உள்ளடக்கங்களில் உடைக்கிறது—எந்த தொழில்நுட்ப பட்டம் தேவையில்லை.
AI கேமரா மாட்யூல் என்றால் என்ன? (சொல்ல வேண்டுமானால்: இது வெறும் “புத்திசாலி கேமரா” அல்ல)
அடிப்படையிலிருந்து தொடங்குவோம்: ஒரு கேமரா மாட்யூல் (AI இல்லாமல்) என்பது காட்சித் தகவலைப் பிடிக்கும் ஒரு சிறிய வன்பொருள் தொகுப்பாகும். இதில் பொதுவாக ஒரு லென்ஸ், ஒரு பட உணரி (ஒளியை மின்னணு சமிக்ஞைகளாக மாற்ற), மூலப் படங்களைச் செம்மைப்படுத்த ஒரு பட சமிக்ஞை செயலி (ISP) மற்றும் பிற சாதனங்களுடன் (ஸ்மார்ட்போன் அல்லது பாதுகாப்பு அமைப்பு போன்றவை) இணைப்பதற்கான இணைப்பிகள் ஆகியவை அடங்கும். இந்த மாட்யூல்கள் எல்லா இடங்களிலும் உள்ளன - உங்கள் தொலைபேசியின் முன்புற கேமராவிலிருந்து வாகன நிறுத்துமிடங்களில் உள்ள பாதுகாப்பு கேமராக்கள் வரை - ஆனால் அவை வரையறுக்கப்பட்டவை: அவை பதிவு செய்ய முடியும், ஆனால் "சிந்திக்க" முடியாது.
ஒரு AI கேமரா மாட்யூல், இரண்டு முக்கிய கூறுகளைச் சேர்ப்பதன் மூலம் இந்த அடித்தளத்தை உருவாக்குகிறது: ஒரு பிரத்யேக AI செயலாக்க அலகு (Neural Processing Unit, NPU போன்றது) மற்றும் முன்கூட்டியே ஏற்றப்பட்ட இயந்திர கற்றல் (ML) அல்காரிதம்கள். இந்த கலவையானது மாட்யூலை ஒரு "தரவு சேகரிப்பாளரிடமிருந்து" ஒரு "புத்திசாலித்தனமான பகுப்பாய்வாளராக" மாற்றுகிறது. இது ஒரு மனித கண் (ஒளியைப் பிடிப்பது) மற்றும் ஒரு மனித மூளை (கண் பார்ப்பதை விளக்குவது) ஆகியவற்றுக்கு இடையேயான வேறுபாடு என்று கற்பனை செய்து பாருங்கள். AI கேமரா மாட்யூலில் காட்சி தரவைப் புரிந்துகொள்ள "கண்" (பாரம்பரிய கேமரா வன்பொருள்) மற்றும் "மூளை" (NPU + அல்காரிதம்கள்) இரண்டும் உள்ளன.
எளிதாகச் சொல்ல வேண்டும் என்றால்: ஒரு சாதாரண கேமரா மாட்யூல், “என்ன பார்க்கப்படுகிறது?” என்ற கேள்விக்கு பதிலளிக்கிறது. ஒரு AI கேமரா மாட்யூல், “நான் பார்க்கும் விஷயம் என்ன அர்த்தம்—நான் இதற்காக என்ன செய்ய வேண்டும்?” என்ற கேள்விக்கு பதிலளிக்கிறது.
பெரும்பாலான வழிகாட்டிகள் தவறவிடும் ஒரு முக்கிய வேறுபாடு இதோ: AI கேமரா தொகுதிகள் எட்ஜ் சாதனங்கள். இதன் பொருள், அவற்றின் பெரும்பாலான செயலாக்கம் கிளவுடில் நடப்பதற்குப் பதிலாக, உள்ளூரிலேயே (தொகுதியிலேயே) நடக்கும். இது ஏன் முக்கியம்? இது தாமதத்தைக் குறைக்கிறது (நொடிகளுக்குப் பதிலாக மில்லி விநாடிகளில் பதில்கள்), அலைவரிசை செலவுகளைக் குறைக்கிறது (முக்கியமான தரவு மட்டுமே கிளவுடுக்கு அனுப்பப்படுகிறது), மற்றும் தனியுரிமையைப் பாதுகாக்கிறது (உணர்திறன் வாய்ந்த தரவு சாதனத்தை விட்டு வெளியேறாது). உதாரணமாக, ஒரு வீட்டுப் பாதுகாப்பு AI கேமரா தொகுதி, ஒரு திருட்டை கண்டறிந்து, கிளவுடுக்கு மணிநேர கணக்கிலான தேவையற்ற காட்சிகளைப் பதிவேற்றாமலேயே உடனடியாக ஒரு எச்சரிக்கையை அனுப்ப முடியும்.
AI கேமரா தொகுதிகளுக்கான உலகளாவிய தேவை விண்ணை முட்டுகிறது: சந்தை 2023 இல் $78 பில்லியனில் இருந்து 2028 இல் $225 பில்லியனாக வளரும் என்று கணிக்கப்பட்டுள்ளது, ஆண்டு வளர்ச்சி விகிதம் 23.6% ஆகும். இந்த எழுச்சி வெறும் "ஸ்மார்ட்" அம்சங்களால் மட்டும் இல்லை - வணிகங்களும் நுகர்வோரும் இந்த தொகுதிகள் உண்மையான சிக்கல்களைத் தீர்க்கின்றன என்பதை உணர்கிறார்கள்: சில்லறை விற்பனையில் திருட்டைக் குறைத்தல், தொழிற்சாலைகளில் பாதுகாப்பை மேம்படுத்துதல் மற்றும் அன்றாட சாதனங்களை மேலும் உள்ளுணர்வுடன் மாற்றுதல்.
ஒரு AI கேமரா தொகுதியின் முக்கிய கூறுகள்: அறிவார்ந்த பார்வையின் "கட்டுமானத் தொகுதிகள்"
AI கேமரா தொகுதிகள் எவ்வாறு செயல்படுகின்றன என்பதைப் புரிந்துகொள்ள, அவற்றின் முக்கிய கூறுகளை முதலில் நீங்கள் தெரிந்து கொள்ள வேண்டும். சில அடிப்படை பாகங்களை மட்டுமே நம்பியிருக்கும் பாரம்பரிய கேமரா தொகுதிகளைப் போலல்லாமல், AI தொகுதிகள் வன்பொருள் மற்றும் மென்பொருளின் ஒருங்கிணைப்பாகும்—ஒவ்வொரு கூறும் ஒளியை அறிவாக மாற்றுவதில் ஒரு முக்கியப் பங்கு வகிக்கிறது. அவற்றை விரிவாகப் பார்ப்போம்:
1. “கண்”: பாரம்பரிய கேமரா வன்பொருள் (லென்ஸ் + பட உணரி + ISP)
ஒவ்வொரு AI கேமரா தொகுதியும் ஒரு நிலையான கேமரா தொகுதியைப் போன்ற அதே அடிப்படை வன்பொருளுடன் தொடங்குகிறது - இதுதான் “பார்க்கும்” பகுதி. ஒவ்வொரு கூறும் எவ்வாறு பங்களிக்கிறது என்பது இங்கே:
• லென்ஸ்: ஒளிக்கதிர்களை இமேஜ் சென்சார் மீது குவிக்கும். நவீன AI கேமரா தொகுதிகள் பெரும்பாலும் பல லென்ஸ் அமைப்புகளை (வைட்-ஆங்கிள், டெலிஃபோட்டோ அல்லது 3D டெப்த் லென்ஸ்கள்) அல்லது சிறப்பு லென்ஸ்களை (தெர்மல் அல்லது இன்ஃப்ராரெட் போன்றவை) பலதரப்பட்ட உணர்திறனுக்காகப் பயன்படுத்துகின்றன. உதாரணமாக, ஒரு பாதுகாப்பு AI கேமரா இருட்டில் பார்க்க இன்ஃப்ராரெட் லென்ஸைப் பயன்படுத்தலாம், அதேசமயம் ஒரு ஸ்மார்ட்போன் தொகுதி போர்ட்ரெய்ட் மோடுக்காக டெப்த் லென்ஸைப் பயன்படுத்தலாம்.
• இமேஜ் சென்சார்: தொகுதியின் “விழித்திரை”. இது ஒளியை (ஃபோட்டான்கள்) மின்னணு சிக்னல்களாகவும் (எலக்ட்ரான்கள்) பின்னர் டிஜிட்டல் தரவுகளாகவும் (பிக்சல்கள்) மாற்றுகிறது. மிகவும் பொதுவான வகை CMOS சென்சார் (Complementary Metal-Oxide-Semiconductor) ஆகும், இது குறைந்த சக்தி மற்றும் உயர்தரமானது - ஸ்மார்ட்போன்கள் மற்றும் பாதுகாப்பு கேமராக்கள் போன்ற உட்பொதிக்கப்பட்ட சாதனங்களுக்கு ஏற்றது. மேம்பட்ட AI தொகுதிகள் உள்ளமைக்கப்பட்ட NPUs உடன் கூடிய புத்திசாலித்தனமான சென்சார்களைப் (Sony's IMX500 போன்றவை) பயன்படுத்துகின்றன, இது செயலாக்கத்தை விரைவுபடுத்துகிறது.
• இமேஜ் சிக்னல் பிராசஸர் (ISP): சென்சாரில் இருந்து வரும் மூலத் தரவைச் செம்மைப்படுத்துகிறது. இது இரைச்சல் (படங்களில் உள்ள சிறு சிறு புள்ளிகள்), மோசமான வெளிச்சம் மற்றும் வண்ணச் சிதைவு போன்ற பொதுவான சிக்கல்களைச் சரிசெய்து, மூலத் தரவைப் பயன்படுத்தக்கூடிய வடிவத்திற்கு (RGB அல்லது YUV போன்றவை) மாற்றுகிறது. AI தொகுதிகளுக்கு, ISP ஆனது NPU-க்காக படங்களை மேம்படுத்துகிறது - தரவு சுத்தமாகவும் பகுப்பாய்வுக்குத் தயாராகவும் இருப்பதை உறுதி செய்கிறது.
2. “மூளை”: AI பிராசஸிங் யூனிட் (NPU/TPU)
ஒரு AI கேமரா தொகுதியை “புத்திசாலித்தனமாக” மாற்றுவதே இதன் முக்கிய அம்சம். ஒரு சாதாரண கேமரா தொகுதி அனைத்துத் தரவையும் ஒரு வெளிப்புற பிராசஸருக்கு (போனின் CPU அல்லது கிளவுட் சர்வர் போன்றவை) அனுப்புகிறது, இது AI பணிகளுக்கு மெதுவாகவும் திறனற்றதாகவும் இருக்கும். AI கேமரா தொகுதிகளில் ஒரு பிரத்யேக நியூரல் பிராசஸிங் யூனிட் (NPU) (அல்லது டென்சர் பிராசஸிங் யூனிட், TPU) உள்ளது - இது இயந்திர கற்றல் அல்காரிதம்களை விரைவாகவும் திறமையாகவும் இயக்க வடிவமைக்கப்பட்ட ஒரு சிப் ஆகும்.
NPUs "inference"-க்காக மேம்படுத்தப்பட்டுள்ளன - இது முன் பயிற்சி பெற்ற AI மாதிரிகளைப் பயன்படுத்தி தரவை பகுப்பாய்வு செய்யும் செயல்முறையாகும் ("training"-க்கு மாறாக, இது சக்திவாய்ந்த கணினிகளில் செய்யப்படுகிறது). உதாரணமாக, ஒரு சில்லறை AI கேமராவில் உள்ள NPU, ஒரு முன் பயிற்சி பெற்ற பொருள் கண்டறிதல் மாதிரியைப் பயன்படுத்தி நிகழ்நேரத்தில் வாடிக்கையாளர்களை எண்ண முடியும், இது CPU-வின் ஒரு பகுதியளவு சக்தியை மட்டுமே பயன்படுத்துகிறது.
NPU-வில் கவனிக்க வேண்டிய முக்கிய விவரக்குறிப்புகள்: TOPS (வினாடிக்கு டிரில்லியன் செயல்பாடுகள்), இது செயலாக்க வேகத்தை அளவிடுகிறது. ஒரு வழக்கமான AI கேமரா மாட்யூலில் 1–20 TOPS கொண்ட NPU உள்ளது—பெரும்பாலான நுகர்வோர் மற்றும் தொழில்துறை பணிகளுக்கு இது போதுமானது. உதாரணமாக, 5 TOPS NPU கொண்ட ஸ்மார்ட்போன் AI மாட்யூல் ஒரே நேரத்தில் முக அங்கீகாரம் மற்றும் போர்ட்ரெய்ட் மோடை இயக்க முடியும், அதேசமயம் 16 TOPS NPU கொண்ட தொழில்துறை மாட்யூல் உற்பத்தி பாகங்களில் உள்ள சிறிய குறைபாடுகளைக் கண்டறிய முடியும்.
3. “அறிவு”: முன்கூட்டியே ஏற்றப்பட்ட AI அல்காரிதம்கள் & மாதிரிகள்
வன்பொருள் மட்டும் போதாது - ஒரு AI கேமரா தொகுதிக்கு காட்சித் தரவை விளக்குவதற்கு "அறிவு" தேவை. இது முன்கூட்டியே பயிற்சி அளிக்கப்பட்ட இயந்திர கற்றல் வழிமுறைகள் மற்றும் மாதிரிகளின் வடிவத்தில் வருகிறது. இந்த மாதிரிகள் குறிப்பிட்ட வடிவங்களை அடையாளம் காண மில்லியன் கணக்கான படங்களில் பயிற்சி அளிக்கப்படுகின்றன: முகங்கள், பொருள்கள், சைகைகள் அல்லது அசாதாரண நடத்தைகள் கூட.
கேமரா தொகுதிகளில் பொதுவாகப் பயன்படுத்தப்படும் AI மாதிரிகள் பின்வருமாறு:
• YOLO (நீங்கள் ஒருமுறை மட்டுமே பார்க்கிறீர்கள்): மக்கள் எண்ணிக்கை, கார்கள் கண்டறிதல் அல்லது ஒரு அலமாரியில் உள்ள தயாரிப்புகளை அடையாளம் காணும் போன்ற நேரடி பணிகளுக்கு பயன்படுத்தப்படும் வேகமான பொருள் கண்டறிதல் மாதிரி. YOLOv8, சமீபத்திய பதிப்பு, மில்லிசெகண்டுகளில் பொருட்களை கண்டறிய முடியும்—கார்கள் போன்றவற்றில் மோதல் தவிர்க்கும் பயன்பாடுகளுக்கு முக்கியமானது.
• CNN (குழு நரம்பியல் நெட்வொர்க்கள்): படம் வகைப்படுத்தல் மற்றும் அம்சங்களை எடுக்க பயன்படுத்தப்படுகிறது. எடுத்துக்காட்டாக, ஒரு CNN ஒரு பூனை மற்றும் நாய் அல்லது ஒரு அனுமதிக்கப்பட்ட ஊழியர் மற்றும் ஒரு புகுந்தவரை வேறுபடுத்த முடியும்.
• DeepSORT: பல பிரேம்களில் உள்ள பொருட்களை (மனிதர்கள் அல்லது கார்கள் போன்றவை) பின்தொடரும் ஒரு கண்காணிப்பு மாதிரி. இது பாதுகாப்பு கேமராக்களில் சந்தேக நபரின் நடமாட்டத்தைக் கண்காணிக்க அல்லது சில்லறை விற்பனையில் வாடிக்கையாளர் பாதைகளை பகுப்பாய்வு செய்யப் பயன்படுகிறது.
• கூட்டாட்சி கற்றல் மாதிரிகள் (Federated Learning Models): AI கேமரா தொகுதிகள் முக்கியமான தகவல்களைப் பகிராமல் உள்ளூர் தரவுகளிலிருந்து “கற்றுக்கொள்ள” அனுமதிக்கும் மேம்பட்ட மாதிரிகள். எடுத்துக்காட்டாக, சில்லறை கடைகளின் ஒரு சங்கிலி வாடிக்கையாளர் காட்சிகளை ஒரு மைய சேவையகத்திற்குப் பதிவேற்றாமல் புதிய தயாரிப்புகளை அங்கீகரிக்க தங்கள் தொகுதிகளைப் பயிற்றுவிக்க முடியும்.
4. “இணைப்பு”: இடைமுகங்கள் & மென்பொருள் ஒருங்கிணைப்பு
இறுதியாக, ஒரு AI கேமரா தொகுதி மற்ற சாதனங்களுடன் (ஸ்மார்ட்போன், டிஸ்ப்ளே அல்லது கிளவுட் பிளாட்ஃபார்ம் போன்றவை) இணைக்கப்பட்டு மென்பொருளுடன் ஒருங்கிணைக்கப்பட வேண்டும். பொதுவான இடைமுகங்களில் MIPI CSI-2 (ஸ்மார்ட்போன்களில் பயன்படுத்தப்படுகிறது), USB (வெப்கேம்களில் பயன்படுத்தப்படுகிறது) மற்றும் LVDS (தொழில்துறை அமைப்புகளில் பயன்படுத்தப்படுகிறது) ஆகியவை அடங்கும். இந்த இடைமுகங்கள் தொகுதியை செயலாக்கப்பட்ட தரவை (எச்சரிக்கைகள், எண்ணிக்கைகள் அல்லது பகுப்பாய்வுகள் போன்றவை) மற்ற சாதனங்களுக்கு அனுப்ப அனுமதிக்கின்றன.
பெரும்பாலான AI கேமரா தொகுதிகள் மென்பொருள் மேம்பாட்டு கருவிகளுடன் (SDKs) வருகின்றன, இது டெவலப்பர்கள் குறிப்பிட்ட பணிகளுக்காக தொகுதியை தனிப்பயனாக்க அனுமதிக்கிறது. எடுத்துக்காட்டாக, ஒரு டெவலப்பர் ஒரு ஸ்மார்ட் ஹோம் சாதனத்திற்காக ஒரு குறிப்பிட்ட சைகையை (கை அசைப்பது போல) அங்கீகரிக்க அல்லது உற்பத்தி வரிசையில் ஒரு குறிப்பிட்ட குறைபாட்டைக் கண்டறிய (கீறல் போல) ஒரு தொகுதியை பயிற்றுவிக்க SDK ஐப் பயன்படுத்தலாம்.
AI கேமரா தொகுதி எவ்வாறு செயல்படுகிறது? படிப்படியான விளக்கம்
கூறுகளை நாம் அறிந்திருப்பதால், ஒரு AI கேமரா தொகுதி ஒளியை எவ்வாறு அறிவாக மாற்றுகிறது என்பதை விரிவாகப் பார்ப்போம். ஒரு நிஜ உலக உதாரணத்தைப் பயன்படுத்துவோம்: வாடிக்கையாளர்களை எண்ணும், அவர்களின் வயது மற்றும் பாலினத்தை பகுப்பாய்வு செய்யும், மற்றும் அலமாரிகள் காலியாக இருக்கும்போது கண்டறியும் ஒரு சில்லறை AI கேமரா தொகுதி. "பார்த்தல்" முதல் "செயல்படுதல்" வரை செயல்முறை இதோ:
படி 1: ஒளியைப் பிடித்து டிஜிட்டல் தரவாக மாற்றுதல்
செயல்முறை லென்ஸுடன் தொடங்குகிறது, இது சில்லறை அங்காடியில் இருந்து வரும் ஒளியை பட உணர்வியின் மீது குவிகிறது. உணர்வி இந்த ஒளியை மின்னணு சமிக்ஞைகளாக (விழித்திரை ஒளியை நரம்பு சமிக்ஞைகளாக மாற்றுவது போல) பின்னர் மூல டிஜிட்டல் தரவுகளாக (பிக்சல்கள்) மாற்றுகிறது. இந்த மூல தரவு பெரும்பாலும் இரைச்சலாகவோ அல்லது குறைந்த தரத்திலோ இருக்கும் - உதாரணமாக, அங்காடியில் மங்கலான வெளிச்சம் இருந்தால், படம் தானியமாக இருக்கலாம்.
ISP பின்னர் இந்த மூல தரவைச் செம்மைப்படுத்துகிறது: இது இரைச்சலைக் குறைக்கிறது, பிரகாசம் மற்றும் வண்ணத்தை சரிசெய்கிறது, மேலும் NPU பயன்படுத்தக்கூடிய வடிவத்திற்கு (RGB போன்றவை) தரவை மாற்றுகிறது. இந்த படி மிகவும் முக்கியமானது - தரவு மோசமாக இருந்தால், AI மாதிரி தவறான கணிப்புகளைச் செய்யும். உதாரணமாக, மங்கலான வெளிச்சம் கொண்ட படம் ஒரு கடைக்காரரை ஒரு மாதிரி உருவமாக தவறாகப் புரிந்துகொள்ளச் செய்யலாம்.
படி 2: AI பகுப்பாய்விற்கான தரவை முன்கூட்டியே செயலாக்குதல்
NPU தரவை பகுப்பாய்வு செய்வதற்கு முன், அதை முன்கூட்டியே செயலாக்க வேண்டும். இதில் படத்தின் அளவை மாற்றுவது (AI மாதிரியின் உள்ளீட்டு அளவிற்கு பொருந்தும் வகையில்), பிக்சல் மதிப்புகளை இயல்பாக்குவது (நிலைத்தன்மையை உறுதி செய்ய), மற்றும் தேவையற்ற பகுதிகளை (கடையின் கூரை அல்லது தரை போன்றவற்றை) வெட்டுவது ஆகியவை அடங்கும். குறைந்தபட்ச தாமதத்தை உறுதிசெய்ய ISP அல்லது NPU மூலம் முன்கூட்டியே செயலாக்கம் விரைவாக செய்யப்படுகிறது.
உதாரணமாக, சில்லறை விற்பனை தொகுதி படத்தை 640x640 பிக்சல்களாக (YOLOv8 மாதிரியின் உள்ளீட்டு அளவு) மாற்றி, அலமாரிகளுக்கு மேலே உள்ள பகுதிகளை வெட்டிவிடும் - வாடிக்கையாளர்கள் மற்றும் தயாரிப்புகள் இருக்கும் பகுதிகளை மட்டுமே இது கவனம் செலுத்தும்.
படி 3: AI அனுமானம் ("சிந்திக்கும்" படி)
இங்குதான் மேஜிக் நடக்கிறது. முன்கூட்டியே செயலாக்கப்பட்ட தரவு NPU-க்கு அனுப்பப்படுகிறது, இது முன்கூட்டியே ஏற்றப்பட்ட AI மாதிரிகள் வழியாக அதை இயக்குகிறது. நமது சில்லறை விற்பனை உதாரணத்தில் என்ன நடக்கிறது என்பதைப் பார்ப்போம்:
• பொருள் கண்டறிதல் (YOLOv8): மாதிரி படத்தைப் ஸ்கேன் செய்து, ஆர்வமுள்ள பொருட்களை - வாடிக்கையாளர்கள் (“person” என பெயரிடப்பட்டவை) மற்றும் தயாரிப்புகள் (“bottle,” “box,” போன்றவை என பெயரிடப்பட்டவை) - கண்டறிகிறது. இது ஒவ்வொரு பொருளைச் சுற்றியும் ஒரு எல்லைப் பெட்டியை வரைகிறது மற்றும் ஒரு நம்பிக்கை மதிப்பை ஒதுக்குகிறது (எ.கா., ஒரு பொருள் வாடிக்கையாளர் என 95% நம்பிக்கை உள்ளது).
• வாடிக்கையாளர் பகுப்பாய்வு (CNN): இரண்டாவது மாதிரி, வயது, பாலினம் மற்றும் மனநிலையையும் (எ.கா., “25–34 வயது, பெண், மகிழ்ச்சி”) தீர்மானிக்க “person” எல்லைப் பெட்டிகளை பகுப்பாய்வு செய்கிறது. இந்தத் தரவு கடையால் சந்தைப்படுத்தல் காட்சிகளைத் தனிப்பயனாக்கப் பயன்படுத்தப்படுகிறது.
• அலமாரி கண்காணிப்பு (தனிப்பயன் மாதிரி): ஒரு மூன்றாவது மாதிரி, காலியான அலமாரிகளைக் கண்டறிய "தயாரிப்பு" எல்லைப் பெட்டிகளைச் சரிபார்க்கிறது. ஒரு குறிப்பிட்ட வரம்பிற்கு மேல் தயாரிப்புகள் இல்லாத அலமாரி, "காலியாக" எனக் குறிக்கப்படும்.
இந்த அனைத்தும் மில்லி விநாடிகளில் நிகழ்கிறது - NPU-வின் மேம்படுத்தப்பட்ட வடிவமைப்புக்கு நன்றி. ஒரு சாதாரண CPU இந்த மாதிரிகளை இயக்க விநாடிகள் எடுக்கும், இது நிகழ்நேர பகுப்பாய்வை சாத்தியமற்றதாக்குகிறது. உதாரணமாக, சில்லறை வணிக தொகுதி வினாடிக்கு 50+ வாடிக்கையாளர்களை 98% துல்லியத்துடன் கணக்கிட முடியும்.
படி 4: செயல்படக்கூடிய நுண்ணறிவுகளை உருவாக்குதல் & முடிவுகளை வெளியிடுதல்
தரவை பகுப்பாய்வு செய்த பிறகு, NPU செயல்படக்கூடிய நுண்ணறிவுகளை உருவாக்குகிறது. எங்கள் சில்லறை வணிக எடுத்துக்காட்டில், இது பின்வருவனவற்றை உள்ளடக்கியிருக்கலாம்: "கடையில் 12 வாடிக்கையாளர்கள் (6 ஆண்கள், 6 பெண்கள்), 3 காலியான அலமாரிகள் (ஷாம்பு, பற்பசை, சோப்பு), மற்றும் மதியம் 2:30 மணிக்கு உச்ச போக்குவரத்து."
அந்த மாட்யூல் இந்த நுண்ணறிவுகளை அதன் இடைமுகம் வழியாக மற்ற சாதனங்களுக்கு அனுப்புகிறது: இது காலியான அலமாரிகளின் எச்சரிக்கைகளை ஒரு ஸ்டோர் மேலாளரின் தொலைபேசிக்கு, வாடிக்கையாளர் எண்ணிக்கையை பகுப்பாய்வு செய்வதற்காக ஒரு கிளவுட் டாஷ்போர்டுக்கு, மற்றும் நிகழ்நேர வீடியோவை (தேவைப்பட்டால் மட்டும்) ஒரு பாதுகாப்பு காட்சிக்கு அனுப்பலாம். முக்கியமாக, நுண்ணறிவுகள் மட்டுமே கிளவுடுக்கு அனுப்பப்படுகின்றன - மூல வீடியோ அல்ல - இது அலைவரிசையைச் சேமித்து தனியுரிமையைப் பாதுகாக்கிறது.
படி 5: கற்றுக்கொள் & தழுவு (விருப்பமானது ஆனால் சக்தி வாய்ந்தது)
மேம்பட்ட AI கேமரா மாட்யூல்கள் கூட்டாட்சி கற்றல் (federated learning) அல்லது ஆன்லைன் கற்றல் (online learning) மூலம் காலப்போக்கில் கற்றுக்கொள்ளவும் தழுவிக்கொள்ளவும் முடியும். உதாரணமாக, ஒரு சில்லறை மாட்யூல் ஒரு புதிய வகை தயாரிப்பை காலியான அலமாரியாக தொடர்ந்து தவறாகக் கண்டறிந்தால், ஸ்டோர் மேலாளர் SDK இல் அந்த தயாரிப்பை லேபிளிடலாம், மேலும் மாட்யூல் உற்பத்தியாளருக்கு திருப்பி அனுப்பப்படாமல் அதன் மாதிரியை உள்ளூரில் புதுப்பிக்கும். இதன் பொருள், கடையின் இருப்பு மாறினாலும், மாட்யூல் காலப்போக்கில் மேலும் துல்லியமாகிறது.
ஒரு சில்லறை விற்பனை ஆய்வு வழக்கில், ஒரு கடைச் சங்கிலி இந்த தகவமைப்பு கற்றல் அம்சத்தைப் பயன்படுத்தி, ஆறு மாதங்களுக்குள், ஐடி குழுக்களின் எந்தவொரு கைமுறை தலையீடும் இல்லாமல், தயாரிப்பு அங்கீகாரத் துல்லியத்தை 82% இலிருந்து 97% ஆக மேம்படுத்தியது.
புதுமையான பயன்பாட்டு வழக்குகள்: AI கேமரா தொகுதிகள் தொழில்களை எவ்வாறு மாற்றுகின்றன
AI கேமரா தொகுதிகளின் மதிப்பை உண்மையாகப் புரிந்துகொள்ள, அடிப்படை பாதுகாப்பு அல்லது புகைப்படங்களுக்கு அப்பாற்பட்ட சில புதுமையான பயன்பாட்டு வழக்குகளைப் பார்ப்போம். இந்த எடுத்துக்காட்டுகள் இந்த தொகுதிகள் சிக்கலான சிக்கல்களை எவ்வாறு தீர்க்கின்றன மற்றும் புதிய வாய்ப்புகளை உருவாக்குகின்றன என்பதைக் காட்டுகின்றன:
1. தொழில்துறை தரக் கட்டுப்பாடு: நுண்ணிய குறைபாடுகளைக் கண்டறிதல்
உற்பத்தியில், AI கேமரா தொகுதிகள் மனித ஆய்வாளர்களுக்குப் பதிலாக, தயாரிப்புகளில் உள்ள மிகச் சிறிய குறைபாடுகளைக் கண்டறியப் பயன்படுத்தப்படுகின்றன—உதாரணமாக, கார் பாகங்களில் 0.02 மிமீ கீறல்கள் அல்லது சர்க்யூட் போர்டுகளில் உள்ள தவறான சாலிடர் இணைப்புகள். இந்த தொகுதிகள் உயர்-தெளிவுத்திறன் கொண்ட சென்சார்கள் மற்றும் சிறப்பு AI மாதிரிகளைப் பயன்படுத்தி, நிமிடத்திற்கு 1,000 தயாரிப்புகள் வரை அதிக வேகத்தில் 99.9% துல்லியத்துடன் தயாரிப்புகளை ஸ்கேன் செய்கின்றன. ஒரு வாகன உதிரிபாக உற்பத்தியாளர் AI கேமரா தொகுதிகளைப் பயன்படுத்திய பிறகு, அதன் குறைபாடு விகிதத்தை 3% இலிருந்து 0.1% ஆகக் குறைத்து, ஆண்டுக்கு 2 மில்லியன் டாலருக்கும் அதிகமான மறுவேலை செலவுகளைச் சேமித்துள்ளது.
2. ஸ்மார்ட் விவசாயம்: கால்நடை நடத்தையைக் கண்காணித்தல்
விவசாயிகள் AI கேமரா தொகுதிகளைப் பயன்படுத்தி கால்நடைகளின் ஆரோக்கியத்தையும் நடத்தையையும் கண்காணிக்கின்றனர் - 24/7 கொட்டகையில் இருக்க வேண்டிய அவசியமில்லை. இந்த தொகுதிகள் வெப்ப உணரிகளையும் AI மாதிரிகளையும் பயன்படுத்தி ஒரு விலங்கின் உடல் வெப்பநிலையில் ஏற்படும் மாற்றங்களையும் (நோயின் அறிகுறி) அல்லது இயக்க முறைகளில் ஏற்படும் மாற்றங்களையும் (மன அழுத்தத்தின் அறிகுறி) கண்டறிகின்றன. உதாரணமாக, ஒரு பால் பண்ணை AI கேமரா தொகுதிகளைப் பயன்படுத்தி அறிகுறிகள் தோன்றுவதற்கு 24 மணி நேரத்திற்கு முன்பே நோய்வாய்ப்பட்ட மாடுகளைக் கண்டறிந்தது, இறப்பு விகிதத்தை 30% குறைத்தது.
3. தானியங்கி மோதல் தவிர்ப்பு: 2D/3D சென்சார் இணைத்தல்
நவீன கார்கள், குறைந்த வெளிச்சம் அல்லது மோசமான வானிலையிலும் பாதசாரிகள், சைக்கிள் ஓட்டுபவர்கள் மற்றும் பிற வாகனங்களைக் கண்டறிய 2D/3D சென்சார் இணைப்பைப் பயன்படுத்தும் AI கேமரா தொகுதிகளைப் பயன்படுத்துகின்றன. இந்த தொகுதிகள், மோதல் அபாயத்தைக் கணக்கிடவும், எச்சரிக்கைகள் அல்லது தானியங்கி பிரேக்கிங்கைத் தூண்டவும், 2D HDR கேமரா (தெளிவான படங்களுக்கு) மற்றும் 3D டைம்-ஆஃப்-ஃப்ளைட் (ToF) சென்சார் (தூரம் அளவிடுவதற்கு) ஆகியவற்றிலிருந்து தரவை இணைக்கின்றன. உதாரணமாக, ifm O3M AI கேமரா 25 மீட்டர் தூரம் வரை பாதசாரிகளைக் கண்டறிந்து, மனிதர்களுக்கும் உயிரற்ற பொருட்களுக்கும் இடையில் வேறுபடுத்தி அறியும் - இது தவறான எச்சரிக்கைகளைக் குறைத்து பாதுகாப்பை மேம்படுத்துகிறது.
4. தொடாமல் தொடர்பு: அசைவு அடையாளம்
AI கேமரா தொகுதிகள் ஸ்மார்ட் கியோஸ்க்குகள், அணியக்கூடிய தொழில்நுட்பம் மற்றும் கார்கள் போன்ற சாதனங்களில் தொடுதலற்ற தொடர்பை செயல்படுத்துகின்றன. இந்த தொகுதிகள் சைகை அங்கீகார வழிமுறைகளைப் பயன்படுத்தி கை அசைவுகளை (அலைத்தல் அல்லது கிள்ளுதல் போன்றவை) கண்டறிந்து அவற்றை கட்டளைகளாக மொழிபெயர்க்கின்றன - எந்தவொரு உடல் தொடுதலும் தேவையில்லை. உதாரணமாக, ஒரு ஷாப்பிங் மாலில் உள்ள ஒரு ஸ்மார்ட் கியோஸ்க், வாடிக்கையாளர்கள் தங்கள் கைகளை அசைப்பதன் மூலம் மெனுக்களை வழிநடத்த AI கேமரா தொகுதியைப் பயன்படுத்துகிறது, இது கிருமிகளின் பரவலைக் குறைத்து பயனர் அனுபவத்தை மேம்படுத்துகிறது.
AI கேமரா தொகுதியைத் தேர்ந்தெடுக்கும்போது முக்கிய கவனிக்க வேண்டியவை
உங்கள் வணிகம் அல்லது திட்டத்திற்காக AI கேமரா தொகுதிகளைப் பயன்படுத்த நீங்கள் விரும்பினால், விலையைத் தாண்டி நீங்கள் கருத்தில் கொள்ள வேண்டிய முக்கிய காரணிகள் இங்கே:
• கணினி சக்தி மற்றும் அல்காரிதம் துல்லியத்தின் சமநிலை: உங்கள் பணிக்கு போதுமான TOPS கொண்ட NPU-ஐத் தேர்ந்தெடுக்கவும் (எ.கா., நுகர்வோர் சாதனங்களுக்கு 1–5 TOPS, தொழில்துறை பணிகளுக்கு 10+ TOPS). மேலும், நீங்கள் தேவைப்படும் AI மாதிரிகளை (எ.கா., பொருள் கண்டறிதலுக்கு YOLOv8) இந்த மாட்யூல் ஆதரிப்பதை உறுதிசெய்யவும்.
• படத் தரம் & சென்சார் வகை: குறைந்த ஒளி சூழல்களுக்கு (கிடங்குகள் போன்றவை), அதிக உணர்திறன் கொண்ட CMOS சென்சார் மற்றும் அகச்சிவப்பு திறன்கள் கொண்ட மாட்யூலைத் தேர்ந்தெடுக்கவும். 3D பணிகளுக்கு (சைகை அங்கீகாரம் போன்றவை), ToF அல்லது டெப்த் சென்சார்கள் கொண்ட மாட்யூல்களைத் தேடுங்கள்.
• எட்ஜ் செயலாக்கத் திறன்கள்: தாமதம் மற்றும் அலைவரிசை செலவுகளைக் குறைக்க, தரவை உள்ளூரில் (எட்ஜ் செயலாக்கம்) செயலாக்கும் தொகுதிகளுக்கு முன்னுரிமை கொடுங்கள். கிளவுட்டை அதிகம் சார்ந்திருக்கும் தொகுதிகளைத் தவிர்க்கவும் - அவை செயல்பட மெதுவாகவும் விலை உயர்ந்ததாகவும் இருக்கும்.
• தனியுரிமை & இணக்கம்: தரவு பாதுகாப்பு விதிமுறைகளுக்கு (GDPR அல்லது CCPA போன்றவை) தொகுதி இணங்குவதை உறுதிசெய்யவும். முக்கியமான தகவல்களைப் பாதுகாக்க தரவு குறியாக்கம், அநாமதேயமாக்கல் (எ.கா., முகங்களை மங்கலாக்குதல்) மற்றும் உள்ளூர் சேமிப்பு போன்ற அம்சங்களைத் தேடுங்கள்.
• இணைப்பு & தனிப்பயனாக்கம்: பயன்படுத்த எளிதான SDK உடன் ஒரு மாடுல் தேர்ந்தெடுக்கவும்—இது உங்கள் குறிப்பிட்ட பணிக்காக மாடுலை தனிப்பயனாக்க அனுமதிக்கும் (எடுத்துக்காட்டாக, உங்கள் தயாரிப்புகள் அல்லது அசைவுகளை அடையாளம் காண பயிற்சி அளிக்கவும்). மேலும், நீங்கள் தேவைப்படும் இடைமுகங்களை ஆதரிக்கிறதா என்பதை சரிபார்க்கவும் (எடுத்துக்காட்டாக, ஸ்மார்ட்போன்களுக்கு MIPI, வெப்கேம்களுக்கு USB).
AI கேமரா மாடுல்களின் எதிர்காலம்: அடுத்தது என்ன?
AI கேமரா தொகுதிகள் வேகமாக உருவாகி வருகின்றன, மேலும் எதிர்காலம் இன்னும் உற்சாகமாகத் தெரிகிறது. கவனிக்க வேண்டிய முக்கிய போக்குகள் இங்கே:
• அறிவாற்றல் நுண்ணறிவு (Cognitive Intelligence): கண்டறிதல் மற்றும் வகைப்படுத்துதலுக்கு அப்பால், தொகுதிகள் சூழலைப் புரிந்துகொள்ளும். எடுத்துக்காட்டாக, ஒரு பாதுகாப்பு தொகுதி ஒரு குழந்தை விளையாடுவதற்கும் ஒரு ஊடுருவும் நபருக்கும் இடையில் வேறுபடுத்தி அறிய முடியும் - தவறான எச்சரிக்கைகளைக் குறைக்கும்.
• பல-கேமரா ஒத்துழைப்பு: ஒரு இடத்தின் 360-டிகிரி பார்வையை உருவாக்க கேமரா தொகுதிகள் கிளஸ்டர்களில் ஒன்றாக வேலை செய்யும். உதாரணமாக, ஒரு ஸ்மார்ட் நகரம் போக்குவரத்து ஓட்டத்தை கண்காணிக்கவும், விபத்துக்களை நிகழ்நேரத்தில் கண்டறியவும் நூற்றுக்கணக்கான AI கேமரா தொகுதிகளைப் பயன்படுத்தும்.
• டிஜிட்டல் ட்வின் ஒருங்கிணைப்பு: தொகுதிகள் டிஜிட்டல் ட்வின்களுடன் (இயற்பியல் இடங்களின் மெய்நிகர் பிரதிகள்) நிகழ்நேர தரவை வழங்க இணைக்கப்படும். உதாரணமாக, ஒரு தொழிற்சாலையின் AI கேமரா தொகுதிகள் உற்பத்தி வரிசையின் டிஜிட்டல் ட்வினுக்கு தரவை வழங்கும் - இது மேலாளர்கள் செயல்பாடுகளை தொலைதூரத்தில் கண்காணிக்க அனுமதிக்கும்.
• பசுமை AI: தொகுதிகள் அதிக ஆற்றல் திறன் கொண்டவையாக மாறும், சிறந்த செயல்திறனை வழங்கும் அதே வேளையில் குறைந்த சக்தியைப் பயன்படுத்தும். அணியக்கூடிய சாதனங்கள் மற்றும் ட்ரோன்கள் போன்ற பேட்டரி மூலம் இயங்கும் சாதனங்களுக்கு இது மிகவும் முக்கியமானது.
2027 ஆம் ஆண்டிற்குள், அனைத்து புதிய கேமராக்களில் 60% AI கேமரா தொகுதிகளாக இருக்கும் என்று நிபுணர்கள் கணிக்கின்றனர் - இது தொழில்துறைகளில் காட்சி உணர்தலுக்கான தரநிலையாக மாறும். அவை இனி "விருப்ப" அம்சங்களாக இருக்காது - அவை வணிகங்கள், நுகர்வோர் மற்றும் நகரங்களுக்கான அத்தியாவசிய கருவிகளாக இருக்கும்.
இறுதி எண்ணங்கள்: AI கேமரா தொகுதிகள் "ஸ்மார்ட் கேமராக்களை" விட அதிகம் - அவை அறிவார்ந்த உலகின் கண்கள்.
AI கேமரா தொகுதிகள் இயந்திரங்கள் உலகைப் பார்க்கும் மற்றும் தொடர்பு கொள்ளும் விதத்தை மாற்றியுள்ளன. அவை பாரம்பரிய கேமராக்களின் மேம்பாடுகள் மட்டுமல்ல - அவை காட்சித் தரவை நிகழ்நேரத்தில் பகுப்பாய்வு செய்யவும், விளக்கமளிக்கவும், செயல்படவும் கூடிய சுய-கட்டுப்பாட்டு அறிவார்ந்த சாதனங்கள். சில்லறை கடைகள் முதல் தொழிற்சாலைகள் வரை, கார்கள் முதல் பண்ணைகள் வரை, இந்த தொகுதிகள் சிக்கலான பிரச்சனைகளைத் தீர்க்கின்றன, செயல்திறனை மேம்படுத்துகின்றன, மேலும் நமது வாழ்க்கையை பாதுகாப்பானதாகவும் வசதியானதாகவும் ஆக்குகின்றன.
உங்கள் ஸ்மார்ட்போனின் போர்ட்ரெய்ட் மோடை அடுத்த முறை பயன்படுத்தும்போதும், ஸ்மார்ட் ஷெல்ஃப்கள் உள்ள கடைக்குள் நுழையும்போதும், அல்லது மோதல் தவிர்ப்பு வசதி கொண்ட காரை ஓட்டும்போதும் நினைவில் கொள்ளுங்கள்: நீங்கள் AI கேமரா மாட்யூல்களின் சக்தியை அனுபவிக்கிறீர்கள். அவை சிறியவை, ஆனால் சக்திவாய்ந்தவை - மேலும் அவை இப்போதுதான் தொடங்குகின்றன. நீங்கள் AI கேமரா மாட்யூல்களைப் பயன்படுத்த விரும்பும் ஒரு வணிகமாக இருந்தாலும் சரி, அல்லது அவற்றின் திறனைப் பற்றி ஆர்வமாக இருக்கும் ஒரு தொழில்நுட்ப ஆர்வலராக இருந்தாலும் சரி, முக்கிய விஷயம் இதுதான்: AI கேமரா மாட்யூல்கள் "பார்ப்பது" மட்டுமல்ல - அவை "புரிந்துகொள்வது" பற்றியது. மேலும் பெருகிய முறையில் புத்திசாலித்தனமான உலகில், அதுவே மிக சக்திவாய்ந்த திறனாகும்.