3 điểm bởi GN⁺ 2024-10-13 | 1 bình luận | Chia sẻ qua WhatsApp

Turin của AMD: ra mắt EPYC thế hệ thứ 5

  • CPU máy chủ 5 gigahertz
    • Đây là bài viết giới thiệu CPU máy chủ mới của AMD là EPYC 9575F, được viết dựa trên trải nghiệm thực hành trực tiếp, khác với Granite Rapids trước đó.
    • Vì sự khác biệt giữa các phiên bản di động và desktop của nhân Zen 5 đã được đề cập trước đó, bài viết này tập trung vào những thay đổi trong hệ thống con bộ nhớ của Turin.

Băng thông bộ nhớ

  • 9575F đạt băng thông đọc bộ nhớ khoảng 52GB/s, băng thông ghi 48GB/s và băng thông đọc-sửa-ghi 95GB/s.
  • Xét mức sử dụng băng thông bộ nhớ trên một CCD, một nhân đơn có thể sử dụng dưới một nửa tổng băng thông đọc bộ nhớ của toàn CCD, khoảng 55% băng thông ghi và hơn 2/3 băng thông đọc-sửa-ghi.
  • 9575F có băng thông tới CCD cao hơn đáng kể so với các linh kiện Zen 5 dành cho desktop, nhờ cung cấp 2 liên kết GMI tới IO die thông qua GMI3-W.
  • Turin hỗ trợ tới DDR5-6400MT/s, nhưng chỉ trên một số hệ thống nhất định với cấu hình 1 DIMM mỗi kênh. Phần lớn hệ thống hỗ trợ 6000MT/s, và khi cấu hình 2 DIMM mỗi kênh thì giảm xuống 4400 MT/s.

Độ trễ bộ nhớ

  • Độ trễ bộ nhớ khi không tải của Turin tương tự Genoa.
  • Kết quả đo độ trễ bộ nhớ khi có tải cho thấy khi một CCD đơn có tải thì tăng khoảng 39 nano giây so với trạng thái không tải, còn khi toàn hệ thống có tải thì tăng khoảng 31 nano giây.
  • Độ trễ trong CCD là khoảng 45ns, độ trễ giữa các CCD là khoảng 150ns, và độ trễ giữa các socket là khoảng 260ns, cho thấy độ trễ đã tăng so với Genoa.

Tốc độ xung nhịp

  • Cả 64 nhân của 9575F đều có thể đạt tối đa 5GHz trong bài kiểm tra đơn luồng, và trong bài kiểm tra băng thông bộ nhớ thì 8 nhân hoạt động ở 5GHz.
  • Khi 128 luồng hoạt động trong Cinebench 2024, 9575F duy trì khoảng 4.3GHz, còn trong khối lượng công việc máy chủ web/giao dịch TLS thì đạt khoảng 4.9GHz.

Kết luận

  • Turin của AMD là một bản cập nhật theo thế hệ mang tính dễ đoán, cung cấp các SKU nhiều nhân và các SKU ít nhân nhưng xung cao để đáp ứng nhu cầu của nhiều thị trường khác nhau.
  • Turin gần với một bước tiến hóa từ Milan sang Genoa hơn là một thay đổi mang tính đột phá như từ Naples sang Rome, bao gồm tăng băng thông bộ nhớ, tăng số lượng nhân và cập nhật nhân xử lý.
  • Thế hệ này mang lại nhiều giá trị trong một hệ sinh thái cạnh tranh và sẽ thu hút sự quan tâm của nhiều người.

Tóm tắt của GN⁺

  • Turin của AMD là một bước tiến quan trọng trong thị trường CPU máy chủ, đặc biệt đáng chú ý ở các cải thiện về băng thông bộ nhớ và hiệu năng nhân.
  • Bài viết này hữu ích cho những ai muốn hiểu công nghệ mới nhất của AMD, đồng thời có thể hỗ trợ các kỹ sư quan tâm đến tối ưu hiệu năng máy chủ.
  • Một sản phẩm có các tính năng tương tự Turin là dòng Xeon của Intel; thông qua việc so sánh với AMD, có thể nắm được ưu và nhược điểm của từng sản phẩm.

1 bình luận

 
GN⁺ 2024-10-13
Ý kiến Hacker News
  • AMD EPYC 9175F là một sản phẩm khá đặc biệt với 16 lõi và 512MB bộ nhớ đệm L3. Có vẻ nó dành cho những khách hàng muốn giảm thiểu chi phí bản quyền tính theo "mỗi lõi". Không rõ Oracle có còn dùng kiểu cấp phép như vậy không

    • Cũng có thể nhắm đến các mục đích cụ thể như HFT, nơi người ta cố đưa toàn bộ thuật toán vào L3 để đạt độ trễ thấp nhất
    • Tuy nhiên, nhiều khả năng chủ yếu vẫn liên quan đến vấn đề bản quyền phần mềm
  • Phoronix đã đăng bài đánh giá so sánh Turin Dense 196 lõi với AmpereOne 192 lõi

    • MSRP của Ampere là $5.5K, còn EPYC là $15K
    • Turin 196 có hiệu năng tốt hơn 1,6 lần
    • Ampere hiệu quả năng lượng hơn 1,2 lần
    • Xét theo $/hiệu năng thực tế, Ampere 192 lõi tốt hơn Turin Dense 196 lõi 1,7 lần
  • Với $5.5K, có thể mua CPU AmpereOne 192 lõi (274w) hoặc CPU Turin Dense 48 lõi (300w)

    • Ampere dự kiến sẽ ra mắt sản phẩm 256 lõi, tiến trình 3nm, 12 kênh bộ nhớ vào năm sau; đây có thể là đối thủ cạnh tranh tốt hơn với Turin Dense và Sierra Forest về mặt hiệu năng
    • Ở thời điểm hiện tại, $/hiệu năng là giá trị cốt lõi trong đề xuất của họ
  • Rất quan tâm đến hiệu năng của chip máy chủ dựa trên Nuvia của Qualcomm

    • Nếu những cải tiến ở lõi client của ARM là một chỉ dấu nào đó, thì rất tò mò các chip tự phát triển như AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace, Alibaba Yitian sẽ cạnh tranh ra sao với các lõi Neoverse tốt hơn
    • Rất mong chờ cuộc cạnh tranh giữa Nuvia, ARM và AmpereOne
  • Có lẽ đây đang là thời kỳ hoàng kim của CPU máy chủ

    • 7 năm trước chỉ có Xeon của Intel
    • Giờ đã có rất nhiều lựa chọn
  • Rất mong Hetzner triển khai máy chủ bare metal AMD Turin

    • Thế hệ trước đã có giá trị rất tốt rồi, nhưng lần này có vẻ còn tiến thêm một bước
  • 20 năm trước, mỗi CPU chỉ có 1-2 lõi, và có được 4 lõi trên một máy chủ dual-socket đã là may mắn

    • Giờ đây một máy chủ đơn lẻ có thể có gần 400 lõi
    • ARM có thể có nhiều lõi hơn, nhưng hiện tại hiệu năng vẫn chưa tốt bằng các dòng này
  • Có một trang thay thế dành cho những người không thích việc chuyển sang Substack

  • Đang chạy một chiếc Dell PowerEdge 12 năm tuổi với dual Xeon

    • Mong đến lúc các máy chủ Epyc thế hệ đầu xuất hiện giá rẻ trên eBay
  • ChipsAndCheese là một trong những ấn phẩm công nghệ mới, có kiến thức đặc biệt sâu, nhất là ở các bài benchmark chuyên sâu

    • Trong bối cảnh những trang công nghệ cũ như Anandtech, TechReport, HardCOP... đã biến mất, thật đáng mừng khi vẫn có nhà xuất bản mới có thể duy trì phong cách đó
  • Ra mắt đúng thời điểm cho Factorio 2.0

  • Muốn xem 9965 hoạt động thực tế ra sao

    • Những linh kiện này thật đáng kinh ngạc
    • Có kế hoạch mua một cỗ máy thuộc thế hệ này
  • Ở mốc 1:11 trong video có biểu đồ TDP

    • Chạy ở mức 125-500W nên khá nóng