1 điểm bởi GN⁺ 2025-05-26 | 1 bình luận | Chia sẻ qua WhatsApp
  • Phát hiện hiện tượng bất thường: Raspberry Pi 2 bị tắt nguồn mỗi khi bị phơi sáng bởi đèn flash xenon của máy ảnh
  • Nguyên nhân của hiện tượng này là hiệu ứng quang điện phát sinh khi ánh sáng lọt vào chip điều chỉnh nguồn (U16) dùng đóng gói WL-CSP
  • Kết quả thử nghiệm của cộng đồng cho thấy đèn flash LED không gây vấn đề, nhưng đèn flash xenon hoặc bút laser lại gây ra lỗi
  • Giải pháp tức thời là che chip U16 bằng vật liệu không trong suốt, nhưng sau đó phần cứng đã được chỉnh sửa để cải tiến thiết kế mạch về mặt căn bản
  • Vụ việc này là một ví dụ tiêu biểu cho thấy thiết bị điện tử siêu nhỏ dễ tổn thương trước nhiễu quang học và tầm quan trọng của sự hợp tác trong cộng đồng

Mở đầu: lỗi kỳ lạ do đèn flash máy ảnh tạo ra

  • Tháng 2/2015, thành viên kỳ cựu của cộng đồng Raspberry Pi là Peter Onion khi chụp chiếc Raspberry Pi 2 mới đã gặp phải vấn đề: cứ mỗi lần flash máy ảnh nổ là Pi lập tức tắt nguồn
  • Sau khi hiện tượng lặp lại nhiều lần và được xác định không phải ngẫu nhiên, ông đã chia sẻ sự việc trên diễn đàn Raspberry Pi
  • Cộng đồng ngay lập tức bắt đầu thử nghiệm với nhiều máy ảnh và nguồn sáng khác nhau, và phát hiện rằng đèn flash LED không gây vấn đề, chỉ khi có đèn flash xenon thì mới xảy ra sập nguồn

Cuộc truy tìm linh kiện dễ tổn thương

  • Quá trình xác định nguyên nhân thực sự là hành trình tìm ra bộ phận nào trên Raspberry Pi 2 dễ bị ảnh hưởng
  • Nhiều cách đã được thử, chẳng hạn che chip xử lý chính bằng Blu-Tack (một loại đất sét dẻo)
  • Khi một số thành viên cộng đồng đặt thiết bị úp ngược để thử, họ xác nhận đây là vấn đề liên quan đến ánh sáng vì thiết bị không còn phản ứng với flash
  • Qua các thử nghiệm bổ sung, họ xác định chip U16 nằm giữa cổng USB và HDMI là nguyên nhân chính; chỉ cần che chip này là vấn đề biến mất hoàn toàn

Vật lý đằng sau “Xenon Death Flash”

  • Chip U16 sử dụng cấu trúc Wafer-Level Chip Scale Packaging (WL-CSP), trong đó khuôn silicon được đặt lộ trực tiếp lên bo mạch mà không có lớp bao bảo vệ
  • Khi tiếp xúc với nguồn sáng cường độ cao từ bên ngoài, hiệu ứng quang điện xuất hiện, khiến các photon năng lượng cao tạo ra dòng electron ngoài dự kiến bên trong chip
  • Điều này ảnh hưởng đến mạch điều chỉnh điện áp và dẫn đến hiện tượng tắt máy ngay lập tức trên Pi 2
  • Đèn flash LED không đủ năng lượng photon nên vô hại, nhưng đèn flash xenon hoặc bút laser có đủ năng lượng để kích hoạt điểm yếu này

Vấn đề nhiễu quang học đã từng tồn tại từ trước

  • Trước Raspberry Pi 2, từng có những trường hợp phát hiện lỗ hổng tương tự liên quan đến nhiễu quang học
  • Một ví dụ tiêu biểu là 12 năm trước đó, chip khuếch đại CSP trong một nguyên mẫu điện thoại di động bị đèn flash máy ảnh làm hoạt động sai
  • Năm 1997, tại nhà máy điện hạt nhân Haddam Neck ở Mỹ, việc chụp ảnh có flash từng gây nhiễu chip EPROM trong bảng điều khiển hỏa hoạn, đến mức kích hoạt cả hệ thống xả khí
  • Đây là bằng chứng cho thấy khi linh kiện điện tử càng thu nhỏ và càng lộ thiên, mức độ dễ tổn thương trước môi trường ánh sáng càng tăng

Cách khắc phục: từ Blu-Tack đến cải tiến thiết kế

  • Biện pháp ứng phó tức thời được khuyến nghị là che chip U16 bằng vật liệu không trong suốt như Blu-Tack, băng keo điện hoặc putty
  • Việc chặn ánh sáng về mặt vật lý giúp tạm thời xử lý điểm yếu này
  • Sau đó, vào nửa cuối năm 2015, ở Raspberry Pi 2 Rev 1.2, cấu trúc quản lý nguồn và chip đã được thay đổi sang nền tảng BCM2837, qua đó loại bỏ tận gốc lỗ hổng quang học này
  • Các mẫu Pi thế hệ trước không bị ảnh hưởng bởi vấn đề này do khác biệt về cấu trúc

Hàm ý về điểm yếu của thiết bị điện tử hiện đại

  • Lỗ hổng của Pi 2 cho thấy việc theo đuổi kích thước siêu nhỏ và chi phí thấp có thể tạo ra những điểm yếu mới ngoài dự kiến
  • Các bài kiểm thử thiết bị điện tử truyền thống thường chỉ xét đến nhiễu điện từ, trong khi việc kiểm tra nhiễu quang học còn thiếu sót
  • Những công nghệ như WL-CSP mang lại lợi ích về kích thước và chi phí, nhưng lại có điểm yếu về mặt bảo vệ
  • Điều này cũng cho thấy môi trường sử dụng bất thường mà trước đây không được tính đến, như chụp bằng đèn flash, có thể làm phát sinh vấn đề mới

Di sản của “lỗi đáng yêu”

  • Raspberry Pi Foundation gọi đây là “lỗi đáng yêu nhất từ trước đến nay” và đã công khai vấn đề một cách minh bạch
  • Vụ việc này đã trở thành một ví dụ giáo dục điện tử thực tế giúp người học trải nghiệm hiệu ứng quang điện trong đời sống
  • Đồng thời, nó cũng góp phần nâng cao nhận thức về vấn đề nhiễu quang học trong thiết kế bán dẫn
  • Dù rất cụ thể, câu chuyện này vẫn nhấn mạnh với toàn ngành nhu cầu đa dạng hóa quy trình kiểm chứng

Bài học cho hiện tại

  • Câu chuyện này nhắc nhở về an ninh phần cứng và tác dụng phụ của việc thu nhỏ quá mức theo hướng tấn công giới hạn thiết kế
  • Các thiết bị nhúng trong kỷ nguyên IoT có thể vẫn tiềm ẩn những lỗ hổng tương tự như Pi 2
  • Những lỗi thú vị thường xuất hiện tại giao điểm giữa các công nghệ tưởng như không liên quan
  • Nó cũng chứng minh sức mạnh của giải quyết vấn đề tập thể như trong cộng đồng Raspberry Pi
  • Đây là một ví dụ tiêu biểu cho thấy sự tò mò và hợp tác có thể giải quyết cả những vấn đề kỳ quái nhất

1 bình luận

 
GN⁺ 2025-05-26
Ý kiến trên Hacker News
  • Tôi muốn nói rằng tính nhạy sáng của linh kiện WLCSP không phải là thứ do cộng đồng “phát hiện” ra. Trong datasheet của WLCSP đã ghi rõ linh kiện đó có tính nhạy sáng, cùng với dữ liệu về ảnh hưởng của ánh sáng lên linh kiện. Đây là điều trong ngành đã biết từ khi WLCSP mới xuất hiện, và bất kỳ kỹ sư có trách nhiệm nào cũng phải xem đó là một yếu tố thiết kế cần cân nhắc. Chip silicon về cơ bản giống như những tấm pin mặt trời tí hon nên đương nhiên sẽ phản ứng với ánh sáng. Cảm biến ảnh CMOS cũng là công nghệ được tạo ra bằng cách chiếu sáng có chủ đích vào chip nhớ, còn chip WLCSP thì thực chất là chip silicon gần như không có đóng gói. Tất cả những điều này đều đã được biết đến từ lâu. Việc decap để mở phần nắp transistor rồi dùng nó như cảm biến quang hoặc pin mặt trời cũng là câu chuyện cũ, và các phototransistor đời đầu cũng dùng vỏ kim loại có cửa sổ thay vì chặn ánh sáng. Nếu gắn trực tiếp WLCSP lên PCB không được bảo vệ mà lại để tính nhạy sáng trở thành vấn đề, thì theo tôi nhà thiết kế либо là người mới, либо cần được giám sát kỹ hơn. Đọc datasheet trước khi áp dụng linh kiện ở quy mô lớn, và hiểu cấu trúc chip silicon cùng nguyên lý tiếp giáp bán dẫn, là năng lực cơ bản của một kỹ sư. Bản thân bài viết thì thú vị, nhưng tôi cảm nhận rất rõ ảnh hưởng của LLM hay AI từ giọng văn thích chen ngang và cách tóm tắt lặp đi lặp lại liên tục
    • Bài viết không hề nói rằng tính nhạy sáng của linh kiện WLCSP là thứ lần đầu được cộng đồng phát hiện. Có một mục tên là "This Wasn’t Actually Unprecedented", trong đó nhắc tới các trường hợp trước đây, nguyên nhân, và còn dẫn liên kết đến các bài liên quan. Điều thực sự mới được làm rõ ở đây là vấn đề nhạy sáng của Raspberry Pi 2, còn bản thân tính nhạy sáng của WLCSP thì vốn đã được biết từ trước. Phần lớn PCB không lộ ra trước người dùng nên vấn đề này đơn giản là ít khi bộc lộ rõ trong thực tế. Tôi nghĩ ý kiến cho rằng nếu dùng WLCSP không được bảo vệ trong điều kiện mà nhạy sáng là không thể chấp nhận thì hẳn nhà thiết kế là người mới là hơi cường điệu. Đây là trường hợp rất hiếm khi có nguồn sáng cực mạnh và rất đặc thù như flash Xenon, lại kết hợp với PCB bị lộ, và cũng có thể datasheet của linh kiện đó không hề đề cập đến chuyện này
    • Cuộc tranh luận y hệt đã có từ 10 năm trước. Trong datasheet mà Raspberry Pi dùng khi đó có ghi rằng: "mạch bảo vệ khỏi tính nhạy sáng được nhắc tới trong tài liệu liên quan thực tế không phải là vấn đề. Silicon chỉ trong suốt với ánh sáng bước sóng dài. Loại ánh sáng này hiếm gặp trong môi trường sử dụng chính của WLCSP" https://web.archive.org/web/20150210111428/https://www.fairchildsemi.com/application-notes/AN/AN-5075.pdf
    • Tôi đồng ý với ý rằng người ta đã gắn chip trần lên một bo mạch không được bảo vệ rồi vẫn kỳ vọng nó hoạt động bình thường. Trước đây cũng từng có các trường hợp nhạy sáng vì lớp encapsulation nhựa không đủ hàm lượng carbon black, và một số linh kiện cũ còn được đóng gói bằng vỏ nhựa nâu không thật sự đục sáng. https://electronics.stackexchange.com/questions/217423/ics-chips-are-typically-packaged-in-what-material
    • Tôi không nghĩ mọi linh kiện WLCSP đều thực sự có tính nhạy sáng rõ rệt. Phần lớn thiết bị CSP có lớp phủ trên bề mặt die, nên vấn đề nhạy sáng có thể chỉ giới hạn ở một số mép hoặc ánh sáng phản xạ. Chỉ một số linh kiện thực sự gây ra vấn đề, và trong trường hợp đó tôi xem nó gần như là lỗi thiết kế. Tùy loại thiết bị đang dùng, nhưng với logic thông thường, bộ xử lý, hay linh kiện nguồn, gần như không có nhạy sáng đáng kể; vấn đề chủ yếu nằm ở các mạch band gap hoặc oscillator nhạy với ánh sáng. Những trường hợp như vậy có thể giảm nhẹ bằng cách thay đổi layout
    • Hôm nay tôi đã học được điều mới! Tôi đã dùng kiểu package này nhiều lần nhưng luôn nghĩ về nó gần như giống BGA. Tôi xem đó chỉ là lựa chọn khi cần thứ gì nhỏ hơn QFN, hoặc khi đó là thứ duy nhất sẵn có, và chỉ chấp nhận đánh đổi là không thể nhìn thấy chân bằng mắt. Cũng kiểu như nếu không phải tín hiệu tốc độ cao hay RF thì khỏi cần quá bận tâm đến footprint. Khi trên bo có nhiều linh kiện và datasheet lại dài, thì việc bỏ sót là điều rất dễ xảy ra. Một khi đã quen với kiểu chỉ đọc những phần quan trọng, thì các chi tiết nhỏ rất dễ bị lướt qua; nhưng trường hợp này cho thấy với thiết bị sản xuất số lượng lớn, việc rà soát kỹ lưỡng lại càng quan trọng hơn
  • Nếu tác giả có đọc HN, tôi muốn nói rằng việc liên tục chèn những thông tin rườm rà không phải giải thích cốt lõi của bài viết (ví dụ: “hiện tượng giúp Einstein nhận Nobel”, “Blu-Tack (thật đấy)”, “câu chuyện về niềm tin cộng đồng”, v.v.) khiến cảm giác khó chịu lặp đi lặp lại nhiều hơn là tạo hứng thú. Tôi thấy trên trang ‘about’ của tác giả có nói LLM được dùng trong quá trình viết, nên tôi muốn đề nghị bớt phụ thuộc vào các công cụ hỗ trợ kiểu này, hoặc ít nhất là xem lại kết quả một cách phê phán hơn. Từ trước đến nay tôi chưa từng đọc bài blog nào mà cảm giác hứng thú và bực mình lại thay nhau xuất hiện rõ đến vậy
    • Ngược lại thì tôi thấy thông tin về Einstein khá hữu ích vì nó giúp tôi nhanh chóng gợi lại những gì đã học trong giờ vật lý. Cách trình bày khiến bài viết giống một câu chuyện hơn là một bản báo cáo, nên tôi đọc thấy thú vị hơn
    • Có thể mỗi người khác nhau, nhưng tôi thấy trong đầu ra của LLM, màu sắc viết lách riêng của từng cá nhân đang dần biến mất, nên tôi khá tiếc cho xu hướng “chỉ cần cho đi qua LLM một lần ở cuối”. Mọi bài viết bắt đầu lặp lại cùng một giọng điệu nên càng đọc càng chán
    • Khi các cụm như “This highlights”, “This contrasts with” lặp đi lặp lại thì đúng là rất khó đọc. Phần mở đầu còn ổn, nhưng từ đoạn kết trở đi tôi thấy nó lặp và nhạt dần
    • Tôi thì thấy mọi phần của bài đều thú vị
    • Tôi đồng ý với ý kiến rằng kiểu ‘viết có AI hỗ trợ’ có lẽ sẽ nhanh chóng gây chán. Mặt khác, thay vì chat với LLM, cũng có thể tốt hơn nếu AI trình bày kết quả tìm kiếm thành tài liệu theo cách người dùng muốn cho từng chủ đề, như tóm tắt ngắn, clip YouTube, podcast, liệt kê sự kiện, v.v. Nếu biết rõ đầu ra đó đến từ máy móc hay giao diện, thì bản thân đầu ra của LLM không khiến tôi thấy quá có vấn đề
  • Một trường hợp bug phần cứng khác mà tôi nhớ tới là vụ “iPhone dị ứng với helium” https://www.ifixit.com/News/11986/iphones-are-allergic-to-he...
    • Điều khiến vụ helium thú vị là vào thời điểm đó, ngay cả các hãng sản xuất thiết bị MEMS cũng chưa nghiên cứu thật sâu tác động của nhiều loại khí môi trường khác nhau. Khác với nhà sản xuất, các kỹ thuật viên hiện trường rất dễ bỏ sót điểm này, và nếu không quen với quy trình chế tạo MEMS thì lại càng khó nhận ra. Có thể với nhà sản xuất thì đây không hẳn là bất ngờ lớn, vì họ dùng hỗn hợp khí đã được kiểm chứng trong bước hiệu chuẩn ban đầu; nhưng với kỹ sư thông thường thì đây là một chi tiết khá khuất mắt
    • Cũng có một video follow-up khá hay về độ nhạy với helium https://www.youtube.com/watch?v=vvzWaVvB908
  • Mọi mẫu Pi số chẵn đều từng có một lỗi phần cứng thú vị
    • Pi 2 : lỗi reboot do flash máy ảnh
    • Pi 4 : lỗi mạch sạc USB-C (nhiều adapter PD không cấp nguồn) https://hackaday.com/2019/07/16/exploring-the-raspberry-pi-4... Tôi đều có các model gốc của Pi 1 và Pi 4, và các lỗi đó chỉ thành vấn đề trong một số môi trường cụ thể. Pi 5, ngoài việc cần 5V/5A (dù với adapter tốt thì thường 5V/3A vẫn chạy ổn), không có vấn đề phần cứng nghiêm trọng nào kiểu như bản 2 hay 4. Thế nên cũng tò mò không biết Pi 6 rồi sẽ gặp chuyện gì
    • Bạn có nhớ mẫu Pi đầu tiên từng bị hoãn phát hành vì lỗi magnetic Ethernet không? Họ cần jack tích hợp magnetics nhưng lại dùng nhầm linh kiện. Nghĩ lại mới thấy họ đã tiến xa đến mức nào
    • Pi 3 từng có vấn đề điện áp và đã được xử lý bằng adapter 5.1V chuyên dụng. Mọi model đều từng có vấn đề về độ bền microSD, và PoE HAT cũng có lỗi. Điểm chung của mọi Raspberry Pi là mạch nguồn tích hợp trên bo quá đơn giản, hoặc gần như không có. Tôi cũng nhớ mang máng từng đọc đâu đó rằng do quy định ở Anh/EU, có những trường hợp bare board không thể được bán như sản phẩm tiêu dùng
    • Pi 1 cũng có lỗi phần cứng. Ví dụ như vấn đề regulator 1.8V của LAN9512, hay brownout ở cổng USB
    • Cũng tò mò không biết dòng Compute Module có gặp những vấn đề kiểu này không
    • Tôi thấy kiểu cường điệu như nói “mọi” mẫu đều vậy thì không có nhiều ý nghĩa, nên cũng hơi thất vọng. Càng tiếc hơn vì đó lại là một người mà tôi vốn rất tôn trọng
  • Thật thú vị khi các tính chất của vật liệu bán dẫn thường có thể đảo ngược. LED là một tấm pin mặt trời kém hiệu quả, và chiều ngược lại cũng đúng. Điểm quan trọng ở đây là nếu kích thích một tiếp giáp bằng nguồn sáng IR cường độ cao, thì tiếp giáp bị kích thích đó cũng sẽ phát ra tia IR ngược lại, và nếu package đủ mỏng thì có thể ghi lại bằng camera. Về lý thuyết, có thể theo dõi sự kích hoạt của một tiếp giáp cụ thể bằng hình ảnh. Tuy nhiên trên thực tế nó không hiệu quả, tín hiệu lại yếu, nên có thể cần overvolt khá nhiều hoặc underclock chip mới thấy được. Tôi cũng không chắc nó có thể đạt mức đủ để thử nghiệm thực tế hay không. Tôi không nhớ tên công ty từng định thương mại hóa kỹ thuật này
    • Một ví dụ vui khác là khi quay động cơ DC bằng tay thì nó sẽ tạo ra dòng điện. Nếu nghĩ theo nguyên lý máy phát điện và động cơ là một thì điều đó hoàn toàn hiển nhiên, nhưng nếu ban đầu chỉ quen với phía động cơ thì đây lại là một nghịch lý khá bất ngờ
  • Tôi nhớ tới trường hợp cache CPU SPARC bị hỏng do phân rã phóng xạ của tạp chất trong package của chip. Ở công việc đầu tiên tôi đã tốn khá nhiều thời gian vì vấn đề này
  • Tôi nhớ mình từng gặp đúng vấn đề tương tự do nắp nhựa trong của máy trợ thính. Khi bị ánh nắng hoặc flash chiếu vào ở một số góc nhất định thì xuất hiện nhiễu, mà chẳng ai tin lời tôi cả
  • Tôi từng dùng DV Cam trên tàu sân bay trong chuyến “Tiger Cruise”, và cứ mỗi 3 giây thì hình video trên boong lại bị trộn kỳ lạ. Nguyên nhân trùng khớp chính xác với chu kỳ quét radar. Tôi lập tức đoán là do bức xạ, rồi chỉnh góc để pin điện thoại (có chứa kim loại nặng) nằm giữa radar và đầu từ, và vấn đề giật hình biến mất hoàn toàn
  • Để lại liên kết tới cuộc thảo luận HN khi đó https://news.ycombinator.com/item?id=9015663
  • Việc debug hậu kỳ với bán dẫn flip-chip cũng có thể thực hiện bằng cách chiếu laser vào một điểm cụ thể rồi phát hiện ánh sáng phản xạ để xác định transistor đang bật hay tắt. Nếu tăng công suất laser, thậm chí còn có thể trực tiếp mở hoặc đóng một transistor nhất định. Bán dẫn vốn dĩ nhạy với ánh sáng, nên người ta mới đóng gói chip bằng vật liệu không trong suốt để bảo vệ điều đó