Giới thiệu: Sự kết thúc của sự thống trị CMOS không phải là điều sẽ đến—nó đã đến.
Khi một chiếc xe tự lái bỏ lỡ một người đi bộ trong điều kiện ánh sáng yếu hoặc một kính hiển vi không theo dõi được các đỉnh thần kinh theo thời gian thực, nguyên nhân không chỉ là giới hạn phần cứng—đó là một mô hình hình ảnh đã 30 năm tuổi. Truyền thống các mô-đun CMOS, xương sống của mọi máy ảnh kỹ thuật số ngày nay, được thiết kế cho một thế giới mà “đủ tốt” có nghĩa là ghi lại các khung hình ở các khoảng thời gian cố định. Nhưng khi các ngành công nghiệp yêu cầu các hệ thống thị giác nhanh hơn, thông minh hơn và hiệu quả hơn, những nút thắt cấu trúc của CMOS đã trở nên không thể vượt qua. Xuất hiện các camera thần kinh: cảm biến lấy cảm hứng từ sinh học không chỉ ghi lại ánh sáng—mà còn diễn giải nó. Đây không phải là một bản nâng cấp từng bước; đó là một sự tái tưởng tượng hoàn toàn về cách chúng ta ghi lại dữ liệu hình ảnh. Đến năm 2030, các chuyên gia dự đoán camera thần kinh sẽ chiếm 45% thị trường hình ảnh hiệu suất cao, từ xe tự hành đến chẩn đoán y tế. Đây là lý do tại sao—và cách mà—chúng đang thay thế các mô-đun CMOS một cách vĩnh viễn. Khuyết điểm ẩn trong CMOS: Nó được xây dựng trên một thỏa hiệp bị hỏng.
Trong nhiều thập kỷ, các nhà sản xuất CMOS đã theo đuổi hai mục tiêu mâu thuẫn: độ phân giải cao hơn và tốc độ khung hình nhanh hơn. CMOS xếp chồng (biến thể mới nhất, được sử dụng trong các điện thoại flagship như iPhone 15 Pro) đã cố gắng giải quyết vấn đề này với công nghệ TSV (Through Silicon Via), tách các lớp pixel khỏi các mạch logic để tăng băng thông. Nhưng phương pháp tạm thời này đã tạo ra những vấn đề mới: TSV hoạt động như các kênh nhiệt, làm tăng nhiệt độ pixel và tăng tiếng ồn. Tệ hơn, CMOS xếp chồng vẫn tuân theo mô hình “dựa trên khung hình” - mỗi pixel thu nhận ánh sáng trong cùng một khoảng thời gian, buộc phải đánh đổi giữa tốc độ và tỷ lệ tín hiệu trên tiếng ồn (SNR).
Xem xét một nhà thần kinh học nghiên cứu hoạt động của não: để theo dõi các đỉnh điện áp ở quy mô mili giây, họ cần hơn 1.000 khung hình mỗi giây. Nhưng cảm biến CMOS ở tốc độ đó thu được rất ít ánh sáng đến nỗi tín hiệu bị chìm trong tiếng ồn. Ngược lại, thời gian phơi sáng lâu hơn để có SNR tốt hơn làm mờ các mục tiêu di chuyển nhanh. Đây không phải là một lỗi trong CMOS - đó là một đặc điểm của thiết kế của nó. Như nhà nghiên cứu MIT Matthew Wilson nói: “Thời gian phơi sáng một kích cỡ phù hợp với tất cả của CMOS là một hạn chế cơ bản khi bạn đang cố gắng hình ảnh hóa các cảnh động, phức tạp.”
Các khuyết điểm khác còn sâu hơn:
• Sự dư thừa dữ liệu: CMOS ghi lại mọi pixel trong mọi khung hình, ngay cả những nền tĩnh, lãng phí 80% băng thông.
• Giới hạn dải động: CMOS truyền thống chỉ đạt tối đa 80–100 dB, không hoạt động tốt trong các môi trường có độ tương phản cao (ví dụ: hoàng hôn trên một khu rừng).
• Độ trễ: Việc chuyển đổi tín hiệu ánh sáng analog thành dữ liệu số và gửi chúng đến bộ xử lý tạo ra độ trễ—chết người cho các ứng dụng như lái xe tự động.
Đây không phải là những vấn đề có thể được khắc phục bằng cách sản xuất tốt hơn. CMOS là nạn nhân của chính kiến trúc của nó. Camera thần kinh, ngược lại, được xây dựng để loại bỏ những thỏa hiệp này.
Camera Thần Kinh: Ba Đổi Mới Đột Phá
Camera thần kinh lấy cảm hứng từ võng mạc của con người, chỉ phát tín hiệu khi ánh sáng thay đổi—không có dữ liệu thừa, không có thời gian phơi sáng cố định. Đây là cách chúng đang viết lại các quy tắc:
1. Pixel Có Thể Lập Trình: Mỗi Pixel Hoạt Động Đúng Mục Đích Của Nó
Bước đột phá lớn nhất đến từ trí tuệ cấp độ pixel. Cảm biến CMOS (PE-CMOS) có thể lập trình được của MIT, được công bố vào năm 2024, cho phép mỗi pixel tự thiết lập thời gian phơi sáng của riêng mình một cách độc lập. Chỉ với sáu transistor cho mỗi pixel (một sự đơn giản hóa của các thiết kế trước đó), các pixel lân cận có thể bổ sung cho nhau: các pixel phơi sáng nhanh theo dõi chuyển động nhanh (ví dụ, các đỉnh thần kinh), trong khi các pixel phơi sáng chậm ghi lại chi tiết trong các vùng tối—tất cả trong cùng một cảnh.
Trong các thử nghiệm, PE-CMOS đạt được độ phân giải đơn đỉnh trong hình ảnh thần kinh, một thành tựu mà CMOS không thể đạt được mà không hy sinh tốc độ. “Chúng tôi không chỉ đang ghi lại ánh sáng—chúng tôi đang tối ưu hóa cách mỗi pixel tương tác với nó,” nhà nghiên cứu chính Jie Zhang giải thích. Sự linh hoạt này loại bỏ sự đánh đổi giữa tốc độ và tỷ lệ tín hiệu trên nhiễu (SNR) mà CMOS gặp phải.
2. Hình ảnh theo sự kiện: Dữ liệu chỉ khi cần thiết
Camera sự kiện (một loại camera thần kinh) đưa điều này đi xa hơn: chúng chỉ tạo ra dữ liệu khi một pixel phát hiện sự thay đổi về cường độ ánh sáng. Thay vì khung hình, chúng xuất ra “sự kiện” — những gói thông tin nhỏ với tọa độ, dấu thời gian và cực tính (ánh sáng tăng lên hoặc giảm xuống).
Kết quả là sự chuyển mình:
• Dải Động 120+ dB: Camera sự kiện xử lý ánh sáng mặt trời trực tiếp và bóng tối đồng thời.
• Độ Trễ Micro giây: Không có bộ đệm khung hình có nghĩa là đầu ra dữ liệu gần như ngay lập tức—quan trọng cho xe tự lái tránh va chạm.
• Giảm 90% Dữ Liệu: Bằng cách bỏ qua các cảnh tĩnh, camera sự kiện giảm yêu cầu băng thông, cắt giảm tiêu thụ điện năng tới 70% so với CMOS.
Các nhà nghiên cứu của Viện Khoa học Ấn Độ đã sử dụng camera sự kiện của iniVation để hình ảnh hóa các hạt nano nhỏ hơn 50 nanomet—vượt qua giới hạn nhiễu xạ của kính hiển vi truyền thống. Dòng dữ liệu thưa thớt của camera cho phép các thuật toán AI tập trung vào các tín hiệu có ý nghĩa, biến tiếng ồn thành thông tin có thể sử dụng.
3. AI Trên Cảm Biến: Xử lý, Không Chỉ Ghi Lại
Khác với CMOS, phụ thuộc vào các bộ xử lý bên ngoài để phân tích hình ảnh, camera thần kinh tích hợp AI trực tiếp vào cảm biến. Các cảm biến xếp chồng mới nhất của Samsung đã bao gồm các mô-đun AI cơ bản để giảm tiếng ồn, nhưng camera thần kinh nâng điều này lên một tầm cao mới: chúng xử lý dữ liệu ngay khi nó được ghi lại.
Ví dụ, cảm biến Metavision của Prophesee sử dụng mạng nơ-ron trên chip để phát hiện đối tượng trong thời gian thực, chỉ gửi dữ liệu liên quan đến bộ xử lý chính. Trong kiểm tra công nghiệp, điều này có nghĩa là xác định các khuyết tật trên dây chuyền sản xuất mà không cần lưu trữ hàng terabyte video không cần thiết. “Camera thần kinh không chỉ là cảm biến hình ảnh—chúng là động cơ nhận thức,” Chetan Singh Thakur, đồng tác giả của nghiên cứu về công nghệ nano, cho biết.
Thay thế Thực Tế: Nơi Camera Thần Kinh Đang Chiến Thắng
Sự chuyển đổi từ CMOS sang camera thần kinh không phải là lý thuyết—nó đang diễn ra ngay hôm nay, bắt đầu với các ứng dụng có giá trị cao nơi mà những khuyết điểm của CMOS là tốn kém nhất:
Khoa Học Thần Kinh & Hình Ảnh Y Tế
PE-CMOS của MIT đã được sử dụng để theo dõi hoạt động thần kinh ở những động vật di chuyển tự do, điều mà CMOS không thể làm được mà không bị mờ hoặc nhiễu. Trong nội soi, độ trễ thấp và dải động cao của camera sự kiện cho phép bác sĩ nhìn thấy bên trong cơ thể mà không cần ánh sáng mạnh, giảm bớt sự khó chịu cho bệnh nhân.
Xe Tự Lái
Tesla và Waymo đang thử nghiệm camera sự kiện cùng với CMOS để loại bỏ điểm mù và giảm thời gian phản ứng. Một camera thần kinh có thể phát hiện một đứa trẻ chạy vào đường nhanh gấp 10 lần so với CMOS, có khả năng ngăn ngừa tai nạn.
Công Nghệ Nano & Khoa Học Vật Liệu
Kính hiển vi mô phỏng thần kinh của IISc hiện đã được thương mại hóa, cho phép các nhà nghiên cứu nghiên cứu chuyển động phân tử với độ chính xác chưa từng có. Đây không chỉ là một bản nâng cấp - mà là một công cụ mới mở rộng những gì có thể trong nghiên cứu khoa học.
Điện Tử Tiêu Dùng (Điểm Dừng Tiếp Theo)
Trong khi camera thần kinh hiện đang đắt hơn CMOS, chi phí đang giảm. Thiết kế pixel đơn giản của MIT giảm độ phức tạp trong sản xuất, và sản xuất hàng loạt sẽ đẩy giá xuống mức của CMOS vào năm 2027. Các điện thoại flagship có khả năng sẽ áp dụng hệ thống hybrid trước tiên—camera thần kinh cho video và ánh sáng yếu, CMOS cho ảnh tĩnh—trước khi hoàn toàn thay thế CMOS vào năm 2030.
Con Đường Thay Thế: Tiến Hóa, Không Cách Mạng
Camera thần kinh sẽ không thay thế CMOS ngay lập tức. Quá trình chuyển đổi sẽ theo ba giai đoạn:
1. Sử Dụng Bổ Sung (2024–2026): Camera thần kinh bổ sung cho CMOS trong các ứng dụng hiệu suất cao (ví dụ: xe tự lái, hình ảnh khoa học).
2. Thay Thế Chọn Lọc (2026–2028): Khi chi phí giảm, camera thần kinh sẽ chiếm lĩnh các thị trường tiêu dùng chuyên biệt (ví dụ: camera hành động, nhiếp ảnh drone) nơi tốc độ và hiệu suất trong ánh sáng yếu là quan trọng nhất.
3. Sự Chiếm Lĩnh Chính (2028–2030): Camera thần kinh trở thành mặc định trong điện thoại thông minh, máy tính xách tay và thiết bị IoT, với CMOS chỉ giới hạn ở các sản phẩm giá rẻ.
Con đường này phản ánh sự chuyển đổi từ CCD sang CMOS vào những năm 2000—được thúc đẩy bởi hiệu suất, không chỉ chi phí. “CMOS thay thế CCD vì nó linh hoạt hơn,” nhà phân tích ngành công nghiệp Sarah Chen cho biết. “Camera thần kinh đang thay thế CMOS vì lý do tương tự: chúng thích ứng với cảnh vật, không phải ngược lại.”
Những Thách Thức Cần Vượt Qua
Mặc dù có tiềm năng, camera thần kinh gặp phải những trở ngại:
• Tiêu chuẩn Ngành: Không có giao thức chung cho dữ liệu sự kiện dẫn đến các vấn đề tương thích giữa cảm biến và phần mềm.
• Độ Nhạy Ánh Sáng Thấp: Mặc dù camera sự kiện xuất sắc trong độ tương phản, nhưng chúng vẫn gặp khó khăn trong bóng tối gần như hoàn toàn—mặc dù nghiên cứu tại MIT đang giải quyết vấn đề này bằng cách cải thiện photodiode.
• Thiên Kiến Nhận Thức: AI trên cảm biến có thể tạo ra thiên kiến nếu không được đào tạo đúng cách, một rủi ro trong các ứng dụng quan trọng về an toàn.
Những thách thức này có thể giải quyết được. Các liên minh như IEEE đang phát triển tiêu chuẩn cho camera sự kiện, và các công ty khởi nghiệp đang đầu tư vào tối ưu hóa ánh sáng yếu. Rào cản lớn nhất không phải là công nghệ—mà là tư duy: các nhà sản xuất và phát triển cần thích ứng với một thế giới mà camera không chỉ chụp ảnh, mà còn hiểu những gì chúng đang thấy.
Kết luận: Tương Lai Của Hình Ảnh Là Camera Thần Kinh
Các mô-đun CMOS truyền thống đã cách mạng hóa nhiếp ảnh bằng cách làm cho máy ảnh kỹ thuật số trở nên dễ tiếp cận. Nhưng chúng bị mắc kẹt trong tư duy dựa trên khung hình mà không thể theo kịp nhu cầu của AI, tự động hóa và khám phá khoa học. Máy ảnh thần kinh không chỉ cải thiện trên CMOS - chúng định nghĩa lại những gì một cảm biến hình ảnh có thể là.
Bằng cách kết hợp các pixel có thể lập trình, dữ liệu theo sự kiện và AI trên cảm biến, máy ảnh thần kinh loại bỏ những thỏa hiệp đã kìm hãm hình ảnh trong nhiều thập kỷ. Chúng nhanh hơn, thông minh hơn và hiệu quả hơn, và chúng đã bắt đầu thay thế CMOS trong các ứng dụng quan trọng nhất. Khi chi phí giảm và công nghệ trưởng thành, máy ảnh thần kinh sẽ trở nên phổ biến như CMOS hiện nay - biến đổi không chỉ cách chúng ta chụp ảnh, mà còn cách chúng ta tương tác với thế giới.
Câu hỏi không phải là liệu camera thần kinh có thay thế CMOS hay không—mà là bạn sẽ áp dụng chúng nhanh như thế nào. Đối với các doanh nghiệp, câu trả lời có thể có nghĩa là giữ vững vị thế trước đối thủ. Đối với người tiêu dùng, điều đó có nghĩa là những bức ảnh đẹp hơn, xe an toàn hơn và những công nghệ mà chúng ta chưa từng tưởng tượng ra. Tương lai của hình ảnh là thần kinh—và nó đang đến nhanh hơn bạn nghĩ.