Düşük Güçlü Kamera Modülleri İçin Yapay Zeka Modeli Sıkıştırma: Donanım-Algoritma Sinerjisi Devrimi

Oluşturuldu 01.04

Qüvvəti az olan kamera modullarının yayılması, ağıllı ev təhlükəsizliyindən və geyilə bilən texnologiyalardan tutmuş sənaye İOT-sinə və ətraf mühitin monitorinqinə qədər sənayeləri yenidən formalaşdırmışdır. Bu yığcam, enerji qənaətli cihazlar, daimi bulud bağlantısı olmadan real vaxt rejimində analitikləri - obyektlərin aşkarlanması, hərəkətin tanınması, üzün təsdiqlənməsi - təmin etmək üçün süni intellektdən istifadə edir. Lakin ən böyük maneə davam edir: ən son süni intellekt modelləri (Transformerlər və ya böyük CNN-lər kimi) hesablama baxımından ağırdır, eyni zamanda qüvvəti az olan kameralar məhdud batareyalar və məhdud emal gücü ilə işləyir. Məhz burada süni intellekt modelinin sıxılması bir oyun dəyişdirici kimi ortaya çıxır. Lakin yalnız alqoritmik dəyişikliklərə diqqət yetirən ənənəvi sıxılma yanaşmalarından fərqli olaraq, qüvvəti az olan cihazlarda səmərəli süni intellektin gələcəyi kameralardonanım-algoritma sinerjisinde yatmaktadır. Bu yazıda, bu işbirlikçi paradigmanın neden kritik olduğunu inceleyecek, düşük güçlü kamera donanımına özel yenilikçi sıkıştırma tekniklerini ele alacak ve bunları gerçek dünya uygulamalarına uygulamak için eyleme geçirilebilir bilgiler paylaşacağız.

Geleneksel Yapay Zeka Sıkıştırması Neden Düşük Güçlü Kamera Modülleri İçin Yetersiz Kalıyor

Yıllardır, yapay zeka model sıkıştırma üç temel stratejiye odaklanmıştır: budama (gereksiz ağırlıkların kaldırılması), niceleme (veri hassasiyetinin 32-bit kayan noktalı sayılardan 8-bit tam sayılara veya daha düşüğe indirilmesi) ve bilgi damıtma (büyük bir "öğretmen" modelden küçük bir "öğrenci" modele öğrenmenin aktarılması). Bu yöntemler model boyutunu ve hesaplama yükünü azaltsa da, düşük güçlü kamera modüllerinin benzersiz kısıtlamalarını—özellikle donanım mimarilerini (örneğin, küçük MCU'lar, kenar TPU'ları veya özel ISP yongaları) ve enerji bütçelerini (genellikle milivat cinsinden ölçülür)—hesaba katmakta sıklıkla başarısız olurlar.

Bir Arm Cortex-M serisi MCU tarafından desteklenen tipik düşük güçlü bir kamera modülünü ele alalım. Geleneksel 8-bit niceleme, bir modeli %75 oranında küçültebilir, ancak MCU'nun 8-bit tamsayı işlemleri için donanım desteği yoksa, sıkıştırılmış model yine de yavaş çalışacak ve pilleri tüketecektir - bu da amacından sapar. Benzer şekilde, kamera bellek bant genişliğini dikkate almayan budama, parçalanmış veri erişimine yol açarak gecikmeyi ve enerji tüketimini artırabilir. Sorun sadece modelleri küçültmek değil; modelleri düşük güçlü kameraların özel donanımıyla uyumlu hale getirmektir. Bu nedenle, donanım-algoritma sinerjisi, etkili sıkıştırma için yeni kutup yıldızı haline gelmiştir.

Yeni Paradigma: Sıkıştırma İçin Donanım-Algoritma Ortak Tasarımı

Donanım-algoritma ortak tasarımı, işleri tersine çevirir: önceden eğitilmiş bir modeli mevcut donanıma sığdırmak için sıkıştırmak yerine, sıkıştırma tekniklerini kamera modülünün donanım mimarisiyle birlikte tasarlarız. Bu yaklaşım, her sıkıştırma seçiminin—hassasiyet seviyelerinden katman yapısına kadar—donanımın güçlü yönleriyle (örneğin, özel yapay zeka hızlandırıcıları, düşük güçlü bellek) uyumlu olmasını ve zayıf yönlerini (örneğin, sınırlı hesaplama çekirdekleri, düşük bant genişliği) azaltmasını sağlar.

Düşük güçlü kamera yapay zekasını dönüştüren üç yenilikçi, sinerji odaklı sıkıştırma tekniğini inceleyelim:

1. Mimariye Duyarlı Budama: Donanım Bellek Hiyerarşilerine Seyreklik Uyarlama

Geleneksel budama, modeldeki rastgele ağırlıkları kaldırarak "yapılandırılmamış" seyrekliği oluşturur. Bu, parametre sayısını azaltsa da, düşük güçlü kameralar için önemli bir enerji tüketicisi olan bellek erişimine yardımcı olmaz. Yapılandırılmamış seyreklik, donanımı hesaplama sırasında boş ağırlıkları atlamaya zorlar, bu da verimsiz bellek okuma/yazma işlemlerine yol açar.

Memarlıq-şüurlu budama, kameranın yaddaş iyerarxiyasına uyğun gələn "strukturlaşdırılmış" seyrəklik yaradaraq bu problemi həll edir. Məsələn, əgər kameranın MCU-su 32-bit yaddaş bloklarından istifadə edirsə, fərdi çəkilər əvəzinə bütün 32-bit çəki bloklarını budamaq, məlumatın ardıcıl qalmasını təmin edir. Stanford Edge AI Lab-ın 2024-cü il tədqiqatına görə, bu, yaddaş bant genişliyindən istifadəni 40%-ə qədər azaldır. Tez-tez 1-2 GB/s yaddaş bant genişliyi məhdudiyyətlərinə malik olan aşağı güclü kameralar üçün bu, əhəmiyyətli enerji qənaətinə və daha sürətli nəticəyə gətirib çıxarır.

Uygulama ipucu: Kameranızın bellek blok boyutuna eşlenen özel budama işlem hatlarıyla TensorFlow Lite for Microcontrollers (TFLite Micro) gibi araçları kullanın. Örneğin, modülünüz bir Nordic nRF5340 MCU (32 bit bellek hizalamalı) kullanıyorsa, budamayı 32 bitlik parçalar halinde ağırlıkları kaldırmak üzere yapılandırın.

2. Hassasiyet Ölçeklendirme: Donanım Hızlandırıcı Desteğine Dayalı Dinamik Kuantizasyon

Düşük güçlü cihazlar için en yaygın kullanılan sıkıştırma tekniği niceleme olsa da, statik niceleme (tüm katmanlar için sabit bir hassasiyet kullanma) potansiyel verimliliği boşa harcar. Modern düşük güçlü kamera modülleri genellikle karışık hassasiyetli işlemleri (örneğin, evrişim katmanları için 8 bit, aktivasyon katmanları için 16 bit) destekleyen Arm’ın CMSIS-NN, Google’ın Coral Micro veya özel TPU'lar gibi özel hızlandırıcılar içerir.

Dinamik, donanıma duyarlı niceleme, hızlandırıcının yeteneklerinden yararlanarak katman başına hassasiyeti ayarlar. Örneğin, hesaplama açısından ağır ancak hassasiyete daha az duyarlı olan bir evrişim katmanı, 4 bit tamsayı kullanabilir (hızlandırıcı destekliyorsa), daha yüksek doğruluk gerektiren bir sınıflandırma katmanı ise 8 bit tamsayı kullanabilir. Önde gelen bir akıllı ev kamerası üreticisinin 2023 tarihli bir vaka çalışması, bu yaklaşımın, hareket algılama için orijinal modelin doğruluğunun %98'ini korurken, statik 8 bit nicelemeye kıyasla enerji tüketimini %35 azalttığını buldu.

Temel araç: Donanım özelliklerine göre hassasiyeti otomatik olarak optimize eden NVIDIA’nın TensorRT Lite'ı veya Cortex-M ve Cortex-A tabanlı kamera modülleri için özel olarak tasarlanmış Arm’ın Vela derleyicisi.

3. Sensör-Birleştirme Sıkıştırması: Erken Özellik Çıkarımı için Kamera ISP'sinden Yararlanma

Düşük güçlü kamera modülleri, veriyi Yapay Zeka modeline beslemeden önce temel görüntü işleme (örneğin, gürültü giderme, otomatik pozlama) işlemlerini yapmak için bir Görüntü Sinyal İşlemcisi (ISP) entegre eder. Çoğu sıkıştırma tekniği ISP'yi göz ardı eder, ancak sensör-birleştirme sıkıştırması, Yapay Zeka modelinin işlemesi gereken veriyi azaltarak ISP'yi bir "ön sıkıştırma" adımı olarak kullanır.

Nasıl çalıştığı şöyledir: ISP, doğrudan ham görüntü sensörü verilerinden düşük seviyeli özellikler (örneğin, kenarlar, dokular) çıkarır. Bu özellikler, tam çözünürlüklü görüntüden daha küçüktür ve işlenmesi daha az hesaplama gücü gerektirir. Yapay Zeka modeli daha sonra ham pikseller yerine bu ISP tarafından çıkarılan özelliklerle çalışacak şekilde eğitilir. Kaliforniya Üniversitesi, Berkeley'den yapılan araştırmalara göre bu, modelin girdi boyutunu %80'e kadar azaltır.

Örneğin, sensör füzyonu sıkıştırması kullanan düşük güçlü bir güvenlik kamerası, ISP'sinin kenar özelliklerini çıkarmasını ve ardından bunları sıkıştırılmış bir nesne algılama modeline iletmesini sağlayabilir. Sonuç: Tam çözünürlüklü görüntüleri işlemeye kıyasla daha hızlı çıkarım (2 kat hızlanma) ve daha düşük enerji kullanımı (%50 azalma).

Pratik Rehber: Düşük Güçlü Kameranız İçin Sinerji Odaklı Sıkıştırma Uygulaması

Bu teknikleri uygulamaya hazır mısınız? Sıkıştırma stratejinizin kamera modülünüzün donanımıyla uyumlu olmasını sağlamak için bu adım adım çerçeveyi izleyin:

Adım 1: Donanım Kısıtlamalarınızı Haritalandırın

İlk olarak, kamera modülünüzün temel donanım özelliklerini belgeleyin:

• İşlemci/hızlandırıcı türü (örneğin, Cortex-M4, Coral Micro, özel TPU)

• Desteklenen hassasiyet seviyeleri (8-bit, 4-bit, karma hassasiyet)

• Bellek bant genişliği ve blok boyutu (örneğin, 32-bit hizalama, 512 KB SRAM)

• Enerji bütçesi (örneğin, sürekli çıkarım için 5 mW)

• ISP yetenekleri (örneğin, özellik çıkarma, gürültü azaltma)

Arm'ın Donanım Profil Aracı veya Google'ın Edge TPU Profil Aracı gibi araçlar bu veri noktalarını toplamanıza yardımcı olabilir.

Adım 2: Donanım Güçleriyle Uyumlu Sıkıştırma Teknikleri Seçin

Sıkıştırma stratejinizi donanımınıza göre ayarlayın:

• Kameranızda özel bir yapay zeka hızlandırıcısı (örneğin, Coral Micro) varsa, hızlandırıcının komut setine özel dinamik niceleme ve bilgi damıtma kullanın.

• Kameranız temel bir MCU (örneğin, Cortex-M0) kullanıyorsa, mimariye duyarlı budamaya (bellek erişimini optimize etmek için) ve sensör birleştirme sıkıştırmasına (girdi boyutunu azaltmak için) öncelik verin.

• Kameranız güçlü bir ISP'ye sahipse, düşük seviyeli özellik çıkarma işlemini hızlandırmak için sensör birleştirme sıkıştırmasını entegre edin.

Adım 3: Donanımı Göz Önünde Bulundurarak Modeli Eğitin ve Sıkıştırın

Modelinizin en başından itibaren optimize edildiğinden emin olmak için donanıma duyarlı eğitim araçlarını kullanın:

• Niceleme sırasında doğruluğu korumak için nicelemeye duyarlı eğitim (QAT) ile modeli eğitin. TFLite Micro ve PyTorch Mobile gibi araçlar QAT'ı destekler.

• Yapısal seyrekliği oluşturmak için budama (pruning) destekli eğitimi kullanın. Örneğin, TensorFlow Model Optimization Toolkit, donanımınızın bellek düzenine uyan budama desenleri (örneğin, 32 bitlik bloklar) tanımlamanıza olanak tanır.

• Sensör füzyonu kullanıyorsanız, uyumluluğu sağlamak için modeli ISP tarafından çıkarılan özellikler üzerinde (ham pikseller yerine) eğitin.

Adım 4: Hedef Donanımda Performansı Doğrulayın

Bir simülatörde test etmek yeterli değildir; ölçmek için sıkıştırılmış modeli gerçek kamera modülünüzde doğrulayın:

• Doğruluk: Sıkıştırmanın performansı düşürmediğinden emin olun (örneğin, çoğu kullanım durumu için nesne algılama doğruluğu %95'in üzerinde kalmalıdır).

• Gecikme Süresi: Gerçek zamanlı çıkarım hedefleyin (örneğin, hareket algılama için kare başına <100 ms).

• Enerji Tüketimi: Çıkarım sırasında pilin tükenmesini ölçmek için Nordic Power Profiler Kit gibi araçlar kullanın.

Doğruluğu, gecikme süresini ve enerji kullanımını dengeleyene kadar sıkıştırma stratejiniz üzerinde yinelemeler yapın.

Gerçek Dünya Başarı Hikayesi: Giyilebilir Bir Kamera Sinerji Odaklı Sıkıştırma Nasıl Kullandı

Gerçek bir örneğe bakalım: Giyilebilir bir fitness kamerası şirketi, düşük güç modülüne (512 KB SRAM'e sahip bir Arm Cortex-M7 MCU ile güçlendirilmiş) gerçek zamanlı aktivite tanıma (örneğin, koşma, yürüme) eklemek istedi. Geleneksel 8-bit niceleme, model boyutunu %75 oranında azalttı, ancak model hala pili 2 saatte tüketiyor ve 200 ms gecikme süresine sahipti - gerçek zamanlı kullanım için çok yavaştı.

Ekip, donanım-algoritma ortak tasarım yaklaşımına geçti:

• 32-bit blok seyrekliği oluşturmak için mimariye duyarlı budama kullanıldı ve bu, MCU'nun bellek hizalamasıyla eşleşti. Bu, bellek bant genişliği kullanımını %38 azalttı.

• Sensör füzyon sıkıştırması entegre edildi: Kameranın ISP'si ham görüntülerden kenar özellikleri çıkardı ve girdi boyutunu %70 azalttı.

• Arm'ın Vela derleyicisini kullanarak dinamik niceleme (evrişim katmanları için 8-bit, aktivasyon katmanları için 16-bit) uygulandı.

Sonuç: Sıkıştırılmış model kare başına 85 ms'de (gerçek zamanlı) çalıştı, pil tüketimini 8 saate indirdi ve %96 aktivite tanıma doğruluğunu korudu. Ürün başarıyla piyasaya sürüldü ve yapay zeka özelliği önemli bir satış noktası haline geldi.

Gelecek Eğilimleri: Düşük Güçlü Kameralarda Yapay Zeka Sıkıştırmada Sonraki Adımlar

Düşük güçlü kamera donanımı geliştikçe, sıkıştırma teknikleri de gelişecektir. İşte dikkat edilmesi gereken üç eğilim:

• Sıkıştırma için Üretken Yapay Zeka: Yapay zeka modelleri, doğası gereği sıkıştırılmış, optimize edilmiş, donanıma özel model mimarileri (örneğin, sinirsel mimari arama veya NAS kullanarak) üretecektir. Google'ın Edge için AutoML gibi araçlar bunu geliştiriciler için erişilebilir hale getirecektir.

• Cihaz İçi Uyarlanabilir Sıkıştırma: Kameralar, kullanım senaryosuna (örneğin, yüz kimlik doğrulaması için daha yüksek hassasiyet, hareket algılama için daha düşük hassasiyet) ve pil seviyesine (örneğin, pil düşükken daha agresif sıkıştırma) göre sıkıştırma seviyelerini dinamik olarak ayarlayacaktır.

• 3D Yığılmış Bellek Entegrasyonu: Gelecekteki düşük güçlü kameralar, veriye daha verimli erişim sağlayacak 3D yığılmış bellek (belleği doğrudan MCU/hızlandırıcının üzerine yerleştirme) kullanacaktır. Sıkıştırma teknikleri, bu mimariden yararlanmak, gecikmeyi ve enerji kullanımını daha da azaltmak için tasarlanacaktır.

Sonuç: Düşük Güçlü Kamera Yapay Zekasını Açığa Çıkarmanın Anahtarı Sinerjidir

AI modelini düşük güçlü kamera modülleri için sıkıştırmak artık sadece modelleri küçültmekle ilgili değil; modellerin donanımla çalışmasını sağlamakla ilgilidir. Donanım-algoritma ortak tasarımı, sıkıştırma tekniklerinin yalnızca enerji ve hesaplama kısıtlamalarına uymasını değil, aynı zamanda daha hızlı, daha verimli yapay zeka sunmak için kameranın benzersiz mimarisinden yararlanmasını sağlar. Mimariye duyarlı budama, dinamik niceleme ve sensör füzyonu sıkıştırmasını benimseyerek, ister akıllı evler, ister giyilebilir cihazlar, ister endüstriyel IoT için olsun, düşük güçlü kamera ürünleriniz için gerçek zamanlı, pil dostu yapay zekanın kilidini açabilirsiniz.

Başlamaya hazır mısınız? Kamera modülünüzün donanım kısıtlamalarını haritalandırarak başlayın, ardından sinerji odaklı bir sıkıştırma stratejisi oluşturmak için özetlediğimiz araçları ve çerçeveleri kullanın. Düşük güçlü kamera yapay zekasının geleceği işbirlikçi ve ulaşılabilir durumda.

Yapay zeka model sıkıştırma, düşük güçlü kamera modülleri

Əlaqə

Məlumatınızı qoyun və biz sizinlə əlaqə saxlayacağıq.

Bizim haqqımızda

Ürünler

Hakkımızda

Destek

+8618520876676

+8613603070842

Haberler

leo@aiusbcam.com

vicky@aiusbcam.com

WeChat