Cách AlphaChip cách mạng hóa thiết kế chip máy tính

(deepmind.google)

7 điểm bởi GN⁺ 2024-09-29 | 1 bình luận | Chia sẻ qua WhatsApp

Năm 2020, chúng tôi đã công bố một preprint giới thiệu phương pháp học tăng cường mới để thiết kế bố cục chip
Phương pháp này sau đó được đăng trên Nature và được cung cấp dưới dạng mã nguồn mở
Hôm nay, chúng tôi công bố một phụ lục trên Nature giải thích chi tiết phương pháp này và tác động của nó đối với lĩnh vực thiết kế chip
Chúng tôi cũng phát hành các checkpoint đã được tiền huấn luyện, chia sẻ trọng số mô hình và công bố tên gọi AlphaChip
Chip máy tính đã thúc đẩy những tiến bộ đáng kinh ngạc của trí tuệ nhân tạo (AI), và AlphaChip sử dụng AI để tăng tốc và tối ưu hóa thiết kế chip
Phương pháp này đã được dùng để tạo ra các bố cục chip ở mức siêu nhân cho 3 thế hệ gần đây nhất của Tensor Processing Unit (TPU), bộ tăng tốc AI tùy biến của Google
AlphaChip là một trong những phương pháp học tăng cường đầu tiên được dùng để giải quyết các bài toán kỹ thuật thực tế
Thay vì cần nhiều tuần hoặc nhiều tháng công sức của con người, nó tạo ra các bố cục chip ở mức siêu nhân hoặc tương đương chỉ trong vài giờ; các bố cục này được sử dụng cho nhiều loại chip, từ trung tâm dữ liệu trên toàn thế giới đến điện thoại di động

AlphaChip hoạt động như thế nào

Thiết kế bố cục chip không phải là một công việc đơn giản
Chip máy tính được cấu thành từ nhiều khối liên kết với nhau, được nối bằng cả các tầng thành phần mạch và những dây dẫn rất mảnh
Đồng thời cũng tồn tại rất nhiều ràng buộc thiết kế phức tạp, đan xen và phải được đáp ứng cùng lúc
Vì độ phức tạp đó, các nhà thiết kế chip đã gặp khó khăn trong việc tự động hóa quy trình floorplanning của chip suốt hơn 60 năm qua
Tương tự AlphaGo và AlphaZero, chúng tôi xây dựng AlphaChip để tiếp cận floorplanning chip như một dạng trò chơi
Bắt đầu từ một lưới trống, AlphaChip đặt từng thành phần mạch một, lặp lại như vậy cho đến khi hoàn tất việc đặt tất cả thành phần
Sau đó, nó nhận phần thưởng dựa trên chất lượng của bố cục cuối cùng
Thông qua một mạng nơ-ron đồ thị mới dựa trên "cạnh", AlphaChip có thể học các mối quan hệ giữa những thành phần chip được liên kết với nhau và khái quát hóa trên toàn bộ chip, nhờ đó tiếp tục cải thiện với mỗi bố cục mà nó thiết kế

Dùng AI để thiết kế chip tăng tốc AI của Google

Kể từ khi được công bố vào năm 2020, AlphaChip đã tạo ra các bố cục chip ở mức siêu nhân được dùng cho mọi thế hệ TPU của Google
Những con chip này cho phép triển khai các mô hình AI quy mô lớn dựa trên kiến trúc Transformer của Google
TPU là cốt lõi của các hệ thống AI tạo sinh mạnh mẽ, từ các mô hình ngôn ngữ lớn như Gemini đến các bộ tạo ảnh và video như Imagen và Veo
Các bộ tăng tốc AI này cũng là thành phần cốt lõi trong các dịch vụ AI của Google và được cung cấp cho người dùng bên ngoài thông qua Google Cloud
Để thiết kế bố cục TPU, AlphaChip trước tiên luyện tập trên nhiều khối chip của các thế hệ trước, như khối mạng trên chip và liên chip, bộ điều khiển bộ nhớ và bộ đệm truyền dữ liệu (điều này được gọi là tiền huấn luyện)
Sau đó, AlphaChip được chạy trên các khối TPU hiện tại để tạo ra bố cục chất lượng cao
Không giống các cách tiếp cận trước đây, AlphaChip trở nên tốt hơn và nhanh hơn khi giải quyết nhiều bài toán bố trí chip hơn, tương tự các chuyên gia con người
AlphaChip đã liên tục thiết kế các bố cục chip tốt hơn cho mỗi thế hệ TPU mới, bao gồm Trillium mới nhất (thế hệ thứ 6), đồng thời đảm nhiệm nhiều phần hơn của toàn bộ floorplan để tăng tốc chu kỳ thiết kế và tạo ra các chip hiệu năng cao hơn

Tác động rộng khắp của AlphaChip

Có thể thấy tác động của AlphaChip thông qua các ứng dụng trên khắp Alphabet, cộng đồng nghiên cứu và toàn ngành thiết kế chip
Vượt ra ngoài việc thiết kế các bộ tăng tốc AI chuyên dụng như TPU, AlphaChip còn tạo bố cục cho các chip khác trong toàn bộ Alphabet, chẳng hạn bộ xử lý Axion, CPU trung tâm dữ liệu đa dụng đầu tiên dựa trên Arm của Google
Các tổ chức bên ngoài cũng đang áp dụng và phát triển tiếp dựa trên AlphaChip (ví dụ: MediaTek, một trong những công ty thiết kế chip hàng đầu thế giới, đã mở rộng AlphaChip để cải thiện điện năng, hiệu năng và diện tích chip, đồng thời đẩy nhanh quá trình phát triển các chip tiên tiến nhất như Dimensity Flagship 5G dùng trong điện thoại Samsung)
AlphaChip đã châm ngòi cho làn sóng bùng nổ các nghiên cứu AI cho thiết kế chip, và đã được mở rộng sang những giai đoạn quan trọng khác của thiết kế chip như tổng hợp logic và lựa chọn macro

Tạo ra những con chip của tương lai

Chúng tôi tin rằng AlphaChip có tiềm năng tối ưu hóa mọi giai đoạn trong chu kỳ thiết kế chip, từ kiến trúc máy tính đến sản xuất
Nó có thể cách mạng hóa thiết kế chip cho phần cứng tùy biến xuất hiện trong các thiết bị hằng ngày như điện thoại thông minh, thiết bị y tế và cảm biến nông nghiệp
Các phiên bản AlphaChip trong tương lai hiện đang được phát triển, và chúng tôi mong được tiếp tục đổi mới trong lĩnh vực này cũng như hợp tác với cộng đồng để tạo ra một tương lai nơi chip nhanh hơn, rẻ hơn và tiết kiệm điện hơn

Ý kiến của GN⁺

Cách tiếp cận dựa trên AI của AlphaChip đang tạo ra một cuộc cách mạng trong lĩnh vực thiết kế chip. Đặc biệt, nó đã đạt được bước tiến lớn trong việc tự động hóa quy trình thiết kế bố cục chip
AlphaChip là một trong những ví dụ đầu tiên về việc áp dụng học tăng cường vào các bài toán kỹ thuật thực tế, và là minh họa tốt cho cách AI có thể được ứng dụng trong thế giới thực
Tác động của AlphaChip lên thiết kế TPU sẽ là một cột mốc quan trọng trong sự phát triển của phần cứng tăng tốc AI. Các bộ tăng tốc AI tốt hơn sẽ cho phép các mô hình AI mạnh hơn, và điều đó lại tiếp tục thúc đẩy sự phát triển của AI nhanh hơn nữa
Tuy nhiên, việc phụ thuộc quá mức vào các công cụ thiết kế AI có thể dẫn đến sự mai một chuyên môn của các nhà thiết kế con người. Về lâu dài, sự cộng tác giữa AI và chuyên gia con người sẽ là điều đáng mong đợi nhất
Các công cụ thiết kế tương tự dựa trên AI gồm có Cerebrus của Cadence, DSO.ai của Synopsys, v.v. Trong thời gian tới, cạnh tranh giữa các công cụ tự động hóa thiết kế dựa trên AI có vẻ sẽ ngày càng khốc liệt

1 bình luận

GN⁺ 2024-09-29

Ý kiến trên Hacker News

Bài báo trên Nature của Google bị các nhà nghiên cứu trong lĩnh vực EDA CAD chỉ trích
- Bài phản biện của một nhà nghiên cứu nội bộ Google: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
- Bài báo ISPD 2023 của nhóm nghiên cứu UCSD: "Assessment of Reinforcement Learning for Macro Placement"
- Bài phê bình của Igor Markov: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
Thuật toán bố trí macro bằng RL của Google đã không được so sánh công bằng với các thuật toán hiện đại khác
- Dù tuyên bố cho hiệu năng bố trí macro tốt hơn con người, nó vẫn không đạt tới hiệu năng của các thuật toán bố trí kết hợp hiện nay
- Kỹ thuật RL đòi hỏi nhiều tài nguyên tính toán hơn các thuật toán khác, và không học một biểu diễn mới của chính bài toán bố trí mà là học một hàm thay thế
Có thái độ hoài nghi với công trình của Google và đã viết một bài đăng chi tiết trên trang web cá nhân
Có trường hợp các nhà nghiên cứu của Google bị quấy rối rồi chuyển sang Anthropic
- Bài liên quan: "Google Brain AI Researcher Fired Tension"
TSMC nhấn mạnh rằng phần mềm tự động hóa thiết kế chip mới nhất có khả năng chọn thiết kế logic cho TDP
- Đây có thể là một cách để duy trì Dennard scaling
- Tốc độ ánh sáng và sự gần gũi vật lý vẫn quan trọng, nhưng người viết tò mò việc tránh thermal throttling sẽ mang lại lợi ích lớn đến mức nào
Đặt câu hỏi về cách đo chất lượng thiết kế chip
- Tò mò liệu các chỉ số mà Google báo cáo có hợp lý hay chỉ đơn giản là để khiến họ trông tốt hơn
- "Chất lượng" của thiết kế chip có nhiều chiều cạnh và phụ thuộc rất lớn vào trường hợp sử dụng
- Chip cho trung tâm dữ liệu sẽ trông rất khác chip cho camera điện thoại di động hoặc ô tô
- Tò mò "tốt hơn" có nghĩa là gì trong bài toán/công việc cụ thể này
Eurisco từng được dùng để thực hiện các tác vụ placement và routing, và đã làm rất tốt
- Eurisco được dùng để thiết kế hạm đội tàu chiến không gian trong trò chơi Traveler TCS
- Eurisco sử dụng cách bố trí dựa trên tính đối xứng học được từ thiết kế VLSI
- Tò mò liệu các heuristic của AlphaChip có thể được dùng ở nơi khác hay không
Công trình thiết kế chip của Google là "gây tranh cãi"
- Tò mò vì sao họ chỉ làm PR mà không thực sự làm điều gì mới
Vấn đề nhiều bài báo DeepX được gửi lên Nature thay vì các diễn đàn CS phù hợp
- Nếu thực sự đang làm công trình tốt hơn trong thiết kế chip thì nên gửi tới IPSD hoặc ISCA
- Không hiểu Nature xử lý các bài báo kiểu này như thế nào
Tò mò vì sao họ cứ tiếp tục dùng cách diễn đạt "siêu nhân"
- Các thuật toán được dùng cho những công việc này, con người không tự tay bố trí hàng nghìn tỷ transistor
Ước gì có công cụ cho thiết kế/bố cục PCB
Tò mò còn bao lâu nữa thì điện toán dựa trên bộ nhớ sẽ chuyển từ nghiên cứu sang sản phẩm có sức cạnh tranh
- Cho rằng đã đến lúc cần đầu tư rất mạnh để mở rộng các thử nghiệm như memristor ở quy mô lớn
- Hiện người ta đang bàn đến việc sẽ cần bao nhiêu lò phản ứng mới cho các trung tâm dữ liệu AI

Cách AlphaChip cách mạng hóa thiết kế chip máy tính

AlphaChip hoạt động như thế nào

Dùng AI để thiết kế chip tăng tốc AI của Google

Tác động rộng khắp của AlphaChip

Tạo ra những con chip của tương lai

Ý kiến của GN⁺

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News