- Năm 2020, chúng tôi đã công bố một preprint giới thiệu phương pháp học tăng cường mới để thiết kế bố cục chip
- Phương pháp này sau đó được đăng trên Nature và được cung cấp dưới dạng mã nguồn mở
- Hôm nay, chúng tôi công bố một phụ lục trên Nature giải thích chi tiết phương pháp này và tác động của nó đối với lĩnh vực thiết kế chip
- Chúng tôi cũng phát hành các checkpoint đã được tiền huấn luyện, chia sẻ trọng số mô hình và công bố tên gọi AlphaChip
- Chip máy tính đã thúc đẩy những tiến bộ đáng kinh ngạc của trí tuệ nhân tạo (AI), và AlphaChip sử dụng AI để tăng tốc và tối ưu hóa thiết kế chip
- Phương pháp này đã được dùng để tạo ra các bố cục chip ở mức siêu nhân cho 3 thế hệ gần đây nhất của Tensor Processing Unit (TPU), bộ tăng tốc AI tùy biến của Google
- AlphaChip là một trong những phương pháp học tăng cường đầu tiên được dùng để giải quyết các bài toán kỹ thuật thực tế
- Thay vì cần nhiều tuần hoặc nhiều tháng công sức của con người, nó tạo ra các bố cục chip ở mức siêu nhân hoặc tương đương chỉ trong vài giờ; các bố cục này được sử dụng cho nhiều loại chip, từ trung tâm dữ liệu trên toàn thế giới đến điện thoại di động
AlphaChip hoạt động như thế nào
- Thiết kế bố cục chip không phải là một công việc đơn giản
- Chip máy tính được cấu thành từ nhiều khối liên kết với nhau, được nối bằng cả các tầng thành phần mạch và những dây dẫn rất mảnh
- Đồng thời cũng tồn tại rất nhiều ràng buộc thiết kế phức tạp, đan xen và phải được đáp ứng cùng lúc
- Vì độ phức tạp đó, các nhà thiết kế chip đã gặp khó khăn trong việc tự động hóa quy trình floorplanning của chip suốt hơn 60 năm qua
- Tương tự AlphaGo và AlphaZero, chúng tôi xây dựng AlphaChip để tiếp cận floorplanning chip như một dạng trò chơi
- Bắt đầu từ một lưới trống, AlphaChip đặt từng thành phần mạch một, lặp lại như vậy cho đến khi hoàn tất việc đặt tất cả thành phần
- Sau đó, nó nhận phần thưởng dựa trên chất lượng của bố cục cuối cùng
- Thông qua một mạng nơ-ron đồ thị mới dựa trên "cạnh", AlphaChip có thể học các mối quan hệ giữa những thành phần chip được liên kết với nhau và khái quát hóa trên toàn bộ chip, nhờ đó tiếp tục cải thiện với mỗi bố cục mà nó thiết kế
Dùng AI để thiết kế chip tăng tốc AI của Google
- Kể từ khi được công bố vào năm 2020, AlphaChip đã tạo ra các bố cục chip ở mức siêu nhân được dùng cho mọi thế hệ TPU của Google
- Những con chip này cho phép triển khai các mô hình AI quy mô lớn dựa trên kiến trúc Transformer của Google
- TPU là cốt lõi của các hệ thống AI tạo sinh mạnh mẽ, từ các mô hình ngôn ngữ lớn như Gemini đến các bộ tạo ảnh và video như Imagen và Veo
- Các bộ tăng tốc AI này cũng là thành phần cốt lõi trong các dịch vụ AI của Google và được cung cấp cho người dùng bên ngoài thông qua Google Cloud
- Để thiết kế bố cục TPU, AlphaChip trước tiên luyện tập trên nhiều khối chip của các thế hệ trước, như khối mạng trên chip và liên chip, bộ điều khiển bộ nhớ và bộ đệm truyền dữ liệu (điều này được gọi là tiền huấn luyện)
- Sau đó, AlphaChip được chạy trên các khối TPU hiện tại để tạo ra bố cục chất lượng cao
- Không giống các cách tiếp cận trước đây, AlphaChip trở nên tốt hơn và nhanh hơn khi giải quyết nhiều bài toán bố trí chip hơn, tương tự các chuyên gia con người
- AlphaChip đã liên tục thiết kế các bố cục chip tốt hơn cho mỗi thế hệ TPU mới, bao gồm Trillium mới nhất (thế hệ thứ 6), đồng thời đảm nhiệm nhiều phần hơn của toàn bộ floorplan để tăng tốc chu kỳ thiết kế và tạo ra các chip hiệu năng cao hơn
Tác động rộng khắp của AlphaChip
- Có thể thấy tác động của AlphaChip thông qua các ứng dụng trên khắp Alphabet, cộng đồng nghiên cứu và toàn ngành thiết kế chip
- Vượt ra ngoài việc thiết kế các bộ tăng tốc AI chuyên dụng như TPU, AlphaChip còn tạo bố cục cho các chip khác trong toàn bộ Alphabet, chẳng hạn bộ xử lý Axion, CPU trung tâm dữ liệu đa dụng đầu tiên dựa trên Arm của Google
- Các tổ chức bên ngoài cũng đang áp dụng và phát triển tiếp dựa trên AlphaChip (ví dụ: MediaTek, một trong những công ty thiết kế chip hàng đầu thế giới, đã mở rộng AlphaChip để cải thiện điện năng, hiệu năng và diện tích chip, đồng thời đẩy nhanh quá trình phát triển các chip tiên tiến nhất như Dimensity Flagship 5G dùng trong điện thoại Samsung)
- AlphaChip đã châm ngòi cho làn sóng bùng nổ các nghiên cứu AI cho thiết kế chip, và đã được mở rộng sang những giai đoạn quan trọng khác của thiết kế chip như tổng hợp logic và lựa chọn macro
Tạo ra những con chip của tương lai
- Chúng tôi tin rằng AlphaChip có tiềm năng tối ưu hóa mọi giai đoạn trong chu kỳ thiết kế chip, từ kiến trúc máy tính đến sản xuất
- Nó có thể cách mạng hóa thiết kế chip cho phần cứng tùy biến xuất hiện trong các thiết bị hằng ngày như điện thoại thông minh, thiết bị y tế và cảm biến nông nghiệp
- Các phiên bản AlphaChip trong tương lai hiện đang được phát triển, và chúng tôi mong được tiếp tục đổi mới trong lĩnh vực này cũng như hợp tác với cộng đồng để tạo ra một tương lai nơi chip nhanh hơn, rẻ hơn và tiết kiệm điện hơn
Ý kiến của GN⁺
- Cách tiếp cận dựa trên AI của AlphaChip đang tạo ra một cuộc cách mạng trong lĩnh vực thiết kế chip. Đặc biệt, nó đã đạt được bước tiến lớn trong việc tự động hóa quy trình thiết kế bố cục chip
- AlphaChip là một trong những ví dụ đầu tiên về việc áp dụng học tăng cường vào các bài toán kỹ thuật thực tế, và là minh họa tốt cho cách AI có thể được ứng dụng trong thế giới thực
- Tác động của AlphaChip lên thiết kế TPU sẽ là một cột mốc quan trọng trong sự phát triển của phần cứng tăng tốc AI. Các bộ tăng tốc AI tốt hơn sẽ cho phép các mô hình AI mạnh hơn, và điều đó lại tiếp tục thúc đẩy sự phát triển của AI nhanh hơn nữa
- Tuy nhiên, việc phụ thuộc quá mức vào các công cụ thiết kế AI có thể dẫn đến sự mai một chuyên môn của các nhà thiết kế con người. Về lâu dài, sự cộng tác giữa AI và chuyên gia con người sẽ là điều đáng mong đợi nhất
- Các công cụ thiết kế tương tự dựa trên AI gồm có Cerebrus của Cadence, DSO.ai của Synopsys, v.v. Trong thời gian tới, cạnh tranh giữa các công cụ tự động hóa thiết kế dựa trên AI có vẻ sẽ ngày càng khốc liệt
1 bình luận
Ý kiến trên Hacker News