NVIDIA công bố GPU H100 dựa trên kiến trúc Hopper

xguru · 2022-03-23T12:03:16+09:00

Tại GTC 2022, NVIDIA công bố kiến trúc Hopper™ thế hệ tiếp theo và H100 được xây dựng trên kiến trúc này. → Tên gọi được đặt theo Grace Hopper. Kế thừa kiến trúc Ampere 6 đổi mới công nghệ giúp tăng tốc AI quy mô lớn và HPC Tích hợp 80 tỷ transistor trên tiến trình 4nm của TSMC. GPU đầu tiên hỗ trợ PCIe Gen5 và sử dụng bộ nhớ HBM3 (băng thông bộ nhớ 3TB/s) Transformer Engine mới cho khả năng tăng tốc gấp 6 lần so với thế hệ trước Công nghệ Multi-Instance GPU (MIG) bảo mật thế hệ thứ 2 cho phép phân vùng một GPU thành các phần nhỏ hơn để thực hiện các tác vụ cách ly. Với kiến trúc Hopper, MIG được cải thiện gấp 7 lần so với thế hệ trước Bộ tăng tốc Confidential Computing đầu tiên giúp bảo vệ mô hình AI đang được xử lý và dữ liệu khách hàng NVIDIA NVLink thế hệ thứ 4 - kết nối tối đa 256 GPU H100 với băng thông cao hơn 9 lần (so với NVIDIA HDR Quantum InfiniBand hiện có) Lệnh DPX mới tăng tốc "lập trình động" được dùng trong thuật toán/tối ưu hóa đường đi/hệ gen học. Nhanh hơn GPU thế hệ trước 7 lần và nhanh hơn CPU 40 lần. Hỗ trợ mô hình ngôn ngữ Megatron 530B với thông lượng cao hơn tối đa 30 lần so với thế hệ trước

(nvidianews.nvidia.com)

2 điểm bởi xguru 2022-03-23 | 1 bình luận | Chia sẻ qua WhatsApp

Tại GTC 2022, NVIDIA công bố kiến trúc Hopper™ thế hệ tiếp theo và H100 được xây dựng trên kiến trúc này.
→ Tên gọi được đặt theo Grace Hopper. Kế thừa kiến trúc Ampere
6 đổi mới công nghệ giúp tăng tốc AI quy mô lớn và HPC
- Tích hợp 80 tỷ transistor trên tiến trình 4nm của TSMC. GPU đầu tiên hỗ trợ PCIe Gen5 và sử dụng bộ nhớ HBM3 (băng thông bộ nhớ 3TB/s)
- Transformer Engine mới cho khả năng tăng tốc gấp 6 lần so với thế hệ trước
- Công nghệ Multi-Instance GPU (MIG) bảo mật thế hệ thứ 2 cho phép phân vùng một GPU thành các phần nhỏ hơn để thực hiện các tác vụ cách ly. Với kiến trúc Hopper, MIG được cải thiện gấp 7 lần so với thế hệ trước
- Bộ tăng tốc Confidential Computing đầu tiên giúp bảo vệ mô hình AI đang được xử lý và dữ liệu khách hàng
- NVIDIA NVLink thế hệ thứ 4 - kết nối tối đa 256 GPU H100 với băng thông cao hơn 9 lần (so với NVIDIA HDR Quantum InfiniBand hiện có)
- Lệnh DPX mới tăng tốc "lập trình động" được dùng trong thuật toán/tối ưu hóa đường đi/hệ gen học. Nhanh hơn GPU thế hệ trước 7 lần và nhanh hơn CPU 40 lần.
Hỗ trợ mô hình ngôn ngữ Megatron 530B với thông lượng cao hơn tối đa 30 lần so với thế hệ trước

1 bình luận

xguru 2022-03-23

MS và Nvidia công bố mô hình ngôn ngữ lớn nhất thế giới MT-NLG 530B

NVIDIA công bố GPU H100 dựa trên kiến trúc Hopper

Bài viết liên quan

1 bình luận