AI học “ma thuật đen” của thiết kế RFIC
(spectrum.ieee.org)- RFIC là nền tảng của các công nghệ không dây như 5G, radar ô tô và truyền thông vệ tinh, nhưng vẫn là một bài toán khó phụ thuộc nhiều vào thao tác thủ công vì phải đồng thời thỏa mãn điện từ, nhiệt và độ tin cậy đóng gói
- Nhóm nghiên cứu Princeton không lấy các mẫu thiết kế do con người tạo ra làm điểm khởi đầu, mà kết hợp học tăng cường với thiết kế ngược để khám phá từ đầu kiến trúc, topology mạch, tham số linh kiện và giao diện điện từ
- Bộ mô phỏng thay thế dựa trên AI có thể dự đoán tham số tán xạ cho các cấu trúc điện từ 2 chiều bất kỳ trong đơn vị mili giây, qua đó cắt giảm mạnh các vòng lặp vốn mất từ vài phút đến hàng giờ của bộ giải điện từ truyền thống
- Năm 2023, với bộ khuếch đại công suất sóng milimet 30~100GHz, hệ thống cho ra kết quả có tổ hợp băng thông, công suất đầu ra và hiệu suất tốt nhất trong các bộ khuếch đại công suất nền silicon thời điểm đó; đến năm 2024, hệ thống còn tạo được cấu trúc IC multiport trong thời gian tính bằng phút
- AI cũng có thể tạo ra các mạch không hoạt động, nên việc kiểm chứng vẫn cần giám sát của con người; để tiến tới mô hình phổ dụng, cần một hệ sinh thái mở nhằm chia sẻ dữ liệu thiết kế RFIC và analog đang bị ràng buộc bởi NDA
Vì sao thiết kế RFIC vẫn là “ma thuật đen”
- RFIC là mạch cốt lõi giúp thiết bị truyền và nhận thông tin không dây, và sự phát triển của xe tự lái, truyền thông lượng tử, 6G và truyền thông vệ tinh cũng phụ thuộc vào các chip RF tiên tiến hơn
- Thiết kế CPU hay GPU ngày nay đã gần với một ngành khoa học được chuẩn hóa, nhưng thiết kế RF vẫn mang đậm tính chất của một kỹ nghệ thủ công được tích lũy qua nhiều năm kinh nghiệm
- Thiết kế RFIC đồng thời xử lý nhiều miền vật lý
- Phương trình Maxwell chi phối cách trường điện từ tương tác với các linh kiện chủ động và thụ động
- Nhiệt động lực học quyết định cách nhiệt được sinh ra và tản đi trong quá trình hoạt động
- Sự giãn nở và co lại vì nhiệt liên quan trực tiếp đến việc chip và package có thể ổn định trước biến đổi nhiệt độ hay không
- Vì phải xem xét đồng thời mọi ràng buộc vật lý, không gian thiết kế trở nên cực lớn, và việc cải thiện một chỉ số hiệu năng thường làm xấu đi chỉ số khác, tạo ra các trade-off thường xuyên
Quy trình thiết kế RFIC truyền thống và các nút thắt
- Để thiết kế một bộ khuếch đại công suất 28GHz cho điện thoại 5G sóng milimet, trước hết cần quyết định kiến trúc mạch và topology
- Kiến trúc RFIC giống như bản thiết kế của một ngôi nhà, xác định các thành phần cần thiết và đường đi của tín hiệu
- Với bộ khuếch đại công suất, số tầng khuếch đại là một yếu tố quan trọng
- Phần lớn diện tích RFIC không phải do transistor mà do các linh kiện thụ động như cuộn cảm, đường truyền và các cấu trúc điện từ chiếm giữ
- Tín hiệu 5G hoạt động ở 28GHz và 39GHz, truyền thông vệ tinh từ 26.5~40GHz trở lên, còn radar ô tô ở 77GHz; RFIC phải quản lý năng lượng tín hiệu ở các tần số cao như vậy bằng những cấu trúc điện từ tinh vi
- Nếu đường tín hiệu không khớp đúng với thành phần kế tiếp, sẽ phát sinh vấn đề phối hợp trở kháng khiến năng lượng không truyền tiếp về phía trước mà bị phản xạ ngược lại
- Kỹ sư sẽ thiết kế những cấu trúc chuyển tiếp rất tinh vi giữa các thành phần để giảm phản xạ
- Các cấu trúc này không chỉ dùng để truyền tín hiệu mà còn có thể dùng để chia, ghép và phân phối theo nhiều đường
- Nếu không đáp ứng được thông số kỹ thuật, phải chỉnh lại topology hoặc kiến trúc rồi lặp lại mô phỏng; một thiết kế chip mới có thể tốn nhiều năm và từ hàng chục triệu đến hàng trăm triệu USD
Cách tiếp cận thiết kế AI vượt ra ngoài template
- Các nghiên cứu trước đây đã dùng machine learning để tối ưu template mạch, nhưng vẫn phụ thuộc vào thư viện thiết kế sẵn có do con người tạo ra
- Mục tiêu của nhóm Princeton là để thuật toán tự quyết định mọi tham số của kiến trúc, mạch cấu thành và cấu trúc thụ động điện từ ngay từ đầu, không cần topology dựng sẵn
- Cách làm này khác ngay từ điểm xuất phát so với tối ưu hóa truyền thống
- Phương pháp cũ điều chỉnh các tham số như kích thước transistor hay hình dạng linh kiện thụ động trên một cấu trúc do con người thiết kế
- Phương pháp mới tạo ra các tổ hợp mạch ứng viên từ một điểm xuất phát gần như trống rỗng, lập bản đồ các trade-off hiệu năng và khám phá không gian thiết kế
- Cách tiếp cận này giống AlphaGo Zero: thay vì đi theo ví dụ của con người, nó phát triển chiến lược thiết kế bằng tự khám phá và tự đánh giá
- Thuật toán học đồng thiết kế giữa mạch, điện từ và sự phối hợp giữa cả hai, với mục tiêu thiết kế RFIC end-to-end
Kết hợp học tăng cường và thiết kế ngược
- Bước đầu tiên là một khung học tăng cường để xác định kiến trúc hệ thống tối ưu, topology mạch, tham số linh kiện và đặc tính giao diện điện từ
- Tác tử học tăng cường, giống như máy tính học chơi game, sẽ thử nhiều tổ hợp khác nhau, quan sát mối quan hệ giữa hành động và điểm số để dần tìm ra mạch tốt hơn
- Quá trình học mất từ vài ngày đến một tuần
- Sau khi học xong, hệ thống có thể thiết kế mạch rất nhanh
- Bước thứ hai là thiết kế ngược để tìm cấu trúc điện từ vật lý tạo ra các tham số tán xạ mong muốn
- Tham số tán xạ đo xem tín hiệu khi đi vào một thành phần sẽ tiếp tục đi tới hay bị phản xạ ngược lại
- Điều này tương tự như trong kỹ thuật kết cấu, khi người ta tìm các vòm hay cấu trúc chống đỡ để tạo ra một không gian mục tiêu
- Thiết kế ngược RFIC khó giải chỉ bằng tìm kiếm thủ công lặp đi lặp lại, vì phải đồng thời khớp hoạt động mạch và đáp ứng điện từ của liên kết nối cùng linh kiện thụ động
Bộ mô phỏng thay thế AI cắt giảm các vòng lặp thiết kế điện từ
- Nhóm nghiên cứu thay bộ mô phỏng mạch RF bằng một emulator dựa trên AI
- Mô hình này nhận đầu vào là cấu trúc 2 chiều bất kỳ rồi dự đoán tham số tán xạ mà không cần trực tiếp giải phương trình Maxwell
- Những tác vụ trước đây mất từ vài phút đến hàng giờ với bộ giải điện từ truyền thống nay được rút xuống còn mili giây
- Emulator được xây dựng dựa trên mạng nơ-ron tích chập, vốn mạnh trong xử lý ảnh
- Ảnh cấu trúc chứa thông tin không gian có thể dùng để dự đoán hiệu năng điện từ
- Nhóm nghiên cứu huấn luyện mô hình bằng nhiều cấu trúc pixel ngẫu nhiên đã được gắn nhãn tham số tán xạ
- Bằng cách kết hợp thiết kế ngược dựa trên học tăng cường với emulator AI, họ tạo nên end-to-end AI designer và áp dụng nó cho thiết kế bộ khuếch đại công suất
Kết quả kiến trúc RF khác con người
- Minh chứng khái niệm được công bố năm 2023 nhắm tới bộ khuếch đại công suất dải sóng milimet 30~100GHz
- Dải này bao phủ phần lớn các tần số 5G và radar liên quan
- Thiết kế cuối cùng khi đó cho ra tổ hợp tốt nhất giữa wide bandwidth, output power và efficiency trong các bộ khuếch đại công suất nền silicon, đồng thời vẫn giữ record efficiency
- Các đường điện từ được tạo ra trông giống các mẫu ngẫu nhiên hay mã QR, khác hẳn những cấu trúc đều đặn và đối xứng mà con người thường nghĩ tới
- Kết quả này cho thấy các template được dùng trong lịch sử không có gì đảm bảo là gần tối ưu cho mục tiêu thiết kế hiện đại
- Sau đó, nhóm nghiên cứu mở rộng mô hình sang các cấu trúc có nhiều cổng vào/ra hơn
- 2 cổng có 4 tham số tán xạ, còn 4 cổng có 16 tham số, nên độ phức tạp tăng rất nhanh
- Trong nghiên cứu multiport integrated circuits năm 2024, họ cho thấy thuật toán AI cũng xử lý được cấu trúc multiport
- Trước đây mô phỏng điện từ multiport cần vài ngày hoặc vài tuần, nhưng mô hình này có thể tiến hóa cấu trúc mới trong thời gian tính bằng phút
- Bằng cách kết hợp khung học tăng cường với thiết kế ngược, nhóm nghiên cứu còn cho thấy một quy trình sinh từ thông số kỹ thuật đến fabrication-ready layout, và đã áp dụng cho bộ khuếch đại nhiễu thấp, subterahertz và power amplifiers băng rộng
Thiết kế AI có thể diễn giải
- Việc kiểm thử và debug RFIC có thể kéo dài ngang bằng hoặc còn khó hơn cả thiết kế, nên kỹ sư ưu tiên các cấu trúc có thể diễn giải để hiểu và sửa khi có vấn đề
- Nhóm nghiên cứu đã áp dụng diffusion models, vốn thường dùng trong AI tạo ảnh, vào việc sinh cấu trúc RFIC
- Thay vì prompt văn bản, họ dùng tham số tán xạ làm đầu vào và sinh ra cấu trúc điện từ của RFIC ở đầu ra
- Họ đưa núm điều chỉnh tần số không gian vào đầu vào để nhà thiết kế có thể kiểm soát hình dạng của cấu trúc đầu ra
- Tần số không gian thấp: dạng cổ điển và dễ diễn giải
- Tần số không gian trung bình: cấu trúc giống mê cung
- Tần số không gian cao: cấu trúc gần như bị pixel hóa hoặc mang dạng ngẫu nhiên
- Toàn bộ quá trình từ prompt đến đầu ra mất khoảng 6 phút, và nếu tham số tán xạ đó có thể hiện thực về mặt vật lý dưới ràng buộc của phương trình Maxwell, hệ thống sẽ sinh ra cấu trúc tương ứng
Những giới hạn còn lại và bài toán dữ liệu
- Cách tiếp cận thiết kế dựa trên AI đã thu hút sự quan tâm của cộng đồng RF và bắt đầu đảo ngược quy trình thiết kế bottom-up truyền thống
- Vẫn còn nhiều câu hỏi chưa được giải đáp
- Phương pháp này có thể tổng quát hóa đến đâu
- Nó có thể duy trì hiệu năng cao một cách ổn định hay không
- Nó có thể tối ưu toàn cục mọi trade-off khả dĩ hay không
- Nó có thể phát minh ra những mạch khác ngoài RFIC mà con người chưa từng tạo ra hay không
- AI có thể sinh ra các mạch tệ không hoạt động dưới dạng hallucination, nên việc kiểm chứng vẫn cần sự giám sát liên tục của con người
- Để xây dựng một foundational model phổ dụng, cần lượng dữ liệu lớn để học các quy luật chi phối điện từ và hoạt động mạch
- ImageNet là ví dụ tiêu biểu: 14 triệu ảnh đa dạng có gắn nhãn bởi con người đã giúp các mô hình nhận dạng ảnh tổng quát hóa tốt hơn
- Thiết kế RFIC và analog cũng cần dữ liệu có quy mô và độ đa dạng tương tự
- Dữ liệu này tồn tại rất nhiều trong các mô phỏng của doanh nghiệp và phòng thí nghiệm trên toàn thế giới, nhưng phần lớn đang bị khóa sau các NDA
- Natcast từng vận hành chương trình R&D của U.S. CHIPS and Science Act và có thể đã củng cố hạ tầng chia sẻ lẫn đổi mới cho công nghệ không dây, cảm biến và quốc phòng thế hệ tiếp theo, nhưng tổ chức này cùng các chương trình liên quan đến machine learning và RFIC đã kết thúc
- Nếu lĩnh vực RFIC mở rộng hợp tác giữa các nhà nghiên cứu AI và nhà thiết kế chip, đồng thời xây dựng một hệ sinh thái mở, thì tiềm năng của thiết kế IC dựa trên AI có thể được khai thác mạnh mẽ hơn
1 bình luận
Các ý kiến trên Hacker News
Gợi nhớ đến tìm kiếm bằng thuật toán di truyền ngày trước. Cách đoán rồi kiểm chứng có thể khá mạnh, nhất là nếu có thể chèn hướng dẫn của tác nhân vào giữa
https://en.wikipedia.org/wiki/Evolved_antenna
Điểm khởi đầu: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Tôi tự hỏi liệu kỳ vọng phổ biến rằng một lý thuyết đích thực phải đẹp và tao nhã ở đâu đó có trụ được thêm một thế kỷ nữa không. Nếu các hiện tượng tự nhiên thực ra được mô tả tốt nhất bằng một đống phương trình cực kỳ lộn xộn mà chỉ máy móc mới xử lý và suy luận được thì sao; nghĩ vậy cũng khá buồn
Câu đùa rằng các nhà vật lý giả định một “con bò hình cầu hoàn hảo” cũng nằm trong bối cảnh này, và thật ra trọng tâm của bài luận “tính hiệu quả phi lý của toán học” cũng gần như vậy. Ý là việc các xấp xỉ toán học mô tả thế giới tốt đến thế tự nó đã là điều đáng kinh ngạc một cách phi lý
Dao cạo Occam là một heuristic hữu ích, nhưng nó cũng khiến chúng ta thiên lệch về phía lời giải thích đơn giản hơn
Một ứng dụng tuyệt vời của thiết kế bằng AI là làm ô nhiễm bằng sáng chế. Dùng AI tạo hàng loạt thiết kế biến thể rồi công bố lên website; về sau nếu có bằng sáng chế xuất hiện, có thể dùng những phần trùng lặp để vô hiệu hóa hoặc ít nhất thu hẹp phạm vi của nó. Vì việc khái quát hóa bằng sáng chế bị giới hạn bởi kỹ thuật đã có trước
Sau đó, ông giải thích lập luận của mình tại một sự kiện TEDx địa phương và thu hút được phần nào chú ý [1]; tôi nhớ các nhà bình luận pháp lý thì khá thờ ơ, nói rằng các thẩm phán vẫn thường phân biệt những khác biệt tinh vi hơn thế nhiều. Dù sao đó cũng là một nỗ lực đáng yêu
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU và
https://www.the-independent.com/tech/music-copyright-algorit...
Hơi bực mình. AI có thể làm nhiều việc, nhưng người ta cứ trộn lẫn LLM với Monte Carlo, thuật toán di truyền, hệ chuyên gia và các thứ học máy truyền thống kiểu phép màu thống kê khác, rồi gộp quá hung hăng các hoạt động học máy vốn đã ổn định và trung lập về mặt đạo đức với những lo ngại về LLM và Stable Diffusion
Và tôi cũng nghĩ có lẽ đó chính là chủ ý
Khi muốn nói rằng có bước tiến lớn ở thứ gì đó, việc nối nó với cách hiểu khoa học đại chúng rằng khoa học viễn tưởng dự báo thành tựu của con người là cách tốn ít công mà hiệu quả cao. Nếu ưu tiên số 1 là làm mọi người phấn khích, thì đó không phải là truyền đạt chính xác
Câu “con người thậm chí còn không tưởng tượng nổi” có vẻ phóng đại. Dù vậy, việc thuật toán học máy có thể dùng tìm kiếm vét cạn để đi tới những thiết kế chip mà chưa ai từng thử, và một phần trong số đó có thể hữu ích với chúng ta, là điều hoàn toàn có vẻ khả thi. Với máy tính thì đây là việc khá hợp lý
Một điều có thể rút ra từ bài viết là để tạo ra những tiến bộ như vậy, họ đã phải bỏ đi các khối xây dựng cơ bản đã được kiểm chứng trong thiết kế chip. Không biết điều tương tự có áp dụng cho lập trình thông thường không. Có phải những đột phá đáng kinh ngạc của AI coding thực ra đang bị Rust và Python cản trở? Có nên để công cụ AI cứ lập trình ở mức thấp nhất có thể không?
Tôi nhớ đến bài cũ này: https://www.damninteresting.com/on-the-origin-of-circuits/
Một trong những viên ngọc nhỏ tôi tìm thấy trên Internet
Ở một bình luận khác gần đây có nhắc đến độ vững chắc của các thiết kế được nuôi lớn trong phòng thí nghiệm, và phần thú vị nhất trong bài Damn Interesting với tôi cũng là việc chương trình đã tiến hóa không thể tách rời khỏi đúng một FPGA vật lý được dùng để huấn luyện. Mô hình học RFIC lần này dùng trình mô phỏng, nên tôi tò mò liệu các đặc tính của phần cứng vật lý chạy trình mô phỏng có được cách ly đủ khỏi quá trình học hay không, để khi chạy trình mô phỏng trên phần cứng khác thì các thiết kế vẫn hoạt động tương tự
Câu hỏi hiển nhiên hơn là liệu thiết kế tiến hóa trong trình mô phỏng có hy vọng hoạt động như kỳ vọng trên phần cứng vật lý thật hay không. Trực giác của tôi về vế sau là không, nhưng đây vẫn có vẻ là nghiên cứu thú vị, và tôi thường nghĩ rằng hiểu đúng những gì thực sự đã xảy ra trên FPGA có thể là điều kiện tiên quyết để xử lý học tăng cường một cách thực sự
Rất vui vì bạn đã đăng bài này; nếu bạn có mục yêu thích nào khác liên quan đến lĩnh vực này thì gửi cho tôi nhé
Câu hỏi lớn nhất là các thiết kế kiểu này vững chắc đến mức nào
Bài báo có cho thấy các phép đo trên thiết bị thật khớp tốt với dự đoán, nhưng tôi không tìm thấy chỗ nào trong bài viết đề cập rõ ràng đến điều này. Ngoài ra, một số hệ thống được trình bày có chứa các khối con được thiết kế theo cách truyền thống, nên có thể phần đó đang gánh một phần vai trò
Có lẽ vì nó có vẻ đang nhắm tới công việc của tôi nên tôi mới nhìn nhận hơi tiêu cực, hoặc có lẽ họ muốn chúng ta nghĩ như vậy
Tôi cho rằng thứ thực sự thắng là những ý tưởng đơn giản có thể chịu được biến động chế tạo, môi trường và giới hạn của mô hình. Những thứ như phản hồi hay tính đối xứng. Nhưng thứ được trình bày ở đây gần như là ngược lại. Tôi đã vài lần tối ưu mù các tham số mạch, và rốt cuộc khi nhận ra một ý tưởng đơn giản mình đã bỏ sót như “ở đây cần tính đối xứng” hay “ở đây cần thêm băng thông”, mọi thứ hoàn toàn trở nên hợp lý. Vì vậy tôi tự hỏi nếu chỉnh vài pixel trong cấu trúc này thì liệu có lộ ra một thứ đơn giản hơn không
Và tất nhiên phải nhắc đến “ăng-ten di truyền”
Theo bài viết, vai trò của AI là thay thế trình mô phỏng điện từ trong quá trình tối ưu hóa để ước lượng hành vi của cấu trúc, và việc này được nói là nhanh hơn mô phỏng nhiều bậc độ lớn
Nghe có vẻ hợp lý, nhưng để tin điều đó, tôi muốn thấy chênh lệch giữa ước lượng của AI và phép đo thực tế đối với các hình học khác đáng kể so với những gì được dùng để huấn luyện AI. Tôi cũng muốn xem tốc độ của mô hình AI được so sánh chính xác với trình mô phỏng nào
Với trường điện từ và mạch điện tử, có nhiều cách mô phỏng đánh đổi giữa độ chính xác và tốc độ. Vì vậy tôi không chắc suy luận AI nhất thiết tốn ít thời gian hơn nhiều so với một mô phỏng độ chính xác thấp nhưng nhanh hơn. Những mô phỏng như vậy cũng có thể chính xác và đáng tin cậy hơn ước lượng của AI
Vì đã có người nói trước rồi, tôi xin thêm một ý liên quan đến chuyện “nhận ra một ý tưởng khá đơn giản”: tôi nghĩ một trong những lợi ích lớn của kiểu thiết kế có máy tính hỗ trợ này là “innovization”[1]. Thuật ngữ hơi gượng, nhưng điểm cốt lõi là các hệ thống như vậy dẫn ta tới hiểu biết sâu hơn về một quá trình cụ thể. Khi trải nghiệm thực tế thì cảm giác khá thú vị
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
Các phương pháp được mô tả trong bài này không mới. Các nhà khoa học đã dùng thuật toán di truyền từ hàng chục năm trước để thiết kế những ăng-ten không ai hiểu nhưng hoạt động tốt
Không phải chuyện ma thuật đến vậy. Như bài viết cũng nói, thiết kế RFIC gần như là thứ ma thuật đen dựa rất nhiều vào kiến thức và kinh nghiệm của nhà thiết kế, vượt xa kỹ thuật RF thông thường, và được hỗ trợ bởi các công cụ mô hình hóa, thiết kế mà vài chục năm trước sẽ ở tầm siêu máy tính
Việc AI có thể làm là duyệt theo chiều rộng mọi kết quả có thể rồi chọn cái có hiệu năng tốt nhất. Khác với cách con người nói “hướng này có vẻ tốt, đào sâu thêm xem sao”