- Tại GTC 2022, NVIDIA công bố kiến trúc Hopper™ thế hệ tiếp theo và H100 được xây dựng trên kiến trúc này.
→ Tên gọi được đặt theo Grace Hopper. Kế thừa kiến trúc Ampere
- 6 đổi mới công nghệ giúp tăng tốc AI quy mô lớn và HPC
- Tích hợp 80 tỷ transistor trên tiến trình 4nm của TSMC. GPU đầu tiên hỗ trợ PCIe Gen5 và sử dụng bộ nhớ HBM3 (băng thông bộ nhớ 3TB/s)
- Transformer Engine mới cho khả năng tăng tốc gấp 6 lần so với thế hệ trước
- Công nghệ Multi-Instance GPU (MIG) bảo mật thế hệ thứ 2 cho phép phân vùng một GPU thành các phần nhỏ hơn để thực hiện các tác vụ cách ly. Với kiến trúc Hopper, MIG được cải thiện gấp 7 lần so với thế hệ trước
- Bộ tăng tốc Confidential Computing đầu tiên giúp bảo vệ mô hình AI đang được xử lý và dữ liệu khách hàng
- NVIDIA NVLink thế hệ thứ 4 - kết nối tối đa 256 GPU H100 với băng thông cao hơn 9 lần (so với NVIDIA HDR Quantum InfiniBand hiện có)
- Lệnh DPX mới tăng tốc "lập trình động" được dùng trong thuật toán/tối ưu hóa đường đi/hệ gen học. Nhanh hơn GPU thế hệ trước 7 lần và nhanh hơn CPU 40 lần.
- Hỗ trợ mô hình ngôn ngữ Megatron 530B với thông lượng cao hơn tối đa 30 lần so với thế hệ trước
1 bình luận
MS và Nvidia công bố mô hình ngôn ngữ lớn nhất thế giới MT-NLG 530B