14 điểm bởi GN⁺ 2026-03-08 | 1 bình luận | Chia sẻ qua WhatsApp
  • Benchmark hiệu năng CPU và hiệu năng/chi phí của 44 loại VM trên 7 dịch vụ đám mây, bao quát cả đơn luồng, đa luồng, instance đặt trước và spot instance
  • AMD EPYC Turin đứng số 1 ở gần như mọi benchmark, nổi lên như CPU cao cấp mới của phe x86
  • Xét hiệu năng theo giá on-demand, Hetzner và Oracle Cloud gần như chiếm trọn nhóm đầu, còn AWS nhìn chung cho hiệu năng/chi phí tệ nhất nếu không tính Turin
  • Intel Granite Rapids khắc phục vấn đề hiệu năng thiếu ổn định của thế hệ trước Emerald Rapids và cung cấp hiệu năng ổn định hơn, nhưng khoảng cách với Turin vẫn còn rất lớn
  • Tận dụng spot instance có thể đạt hiệu năng trên mỗi đô la cao gấp khoảng 2 lần so với đặt trước 3 năm, nên đây là công cụ cốt lõi để tối ưu chi phí đám mây

Tổng quan benchmark và phương pháp luận

  • Đối tượng so sánh: 7 nhà cung cấp AWS, GCP, Azure, Oracle Cloud(OCI), Akamai(Linode), DigitalOcean, Hetzner, với 44 loại VM
  • Để thống nhất việc so sánh chi phí, mọi instance đều được cấu hình theo chuẩn 2vCPU, 2GB/vCPU RAM, 30GB SSD
  • Với AMD·Intel, do có SMT (hyperthreading), 2vCPU = 1 lõi vật lý; với ARM và một số ngoại lệ x86 (AWS C8a, C7a, GCP t2d), 2vCPU = 2 lõi vật lý
  • Giá on-demand lấy theo region rẻ nhất tại Mỹ, tại thời điểm tháng 1/2026; cần kiểm tra lại giá hiện tại riêng biệt
  • Công cụ benchmark sử dụng: DKbench (benchmark chính, gồm 19 workload máy chủ dựa trên Perl·C/XS), Geekbench 5, 7zip, NGINX, FFmpeg/libx264, OpenSSL RSA4096(AVX512)
    • Không dùng Geekbench 6 vì cho rằng cách đo multicore của nó có lỗi thiết kế
  • Để xác định biên độ hiệu năng, các instance được tạo và đo lặp lại ở nhiều region, sau đó hiển thị theo khoảng giá trị nhỏ nhất·lớn nhất

Tổng quan các tier hiệu năng theo thế hệ CPU

  • AMD: Rome → Milan → Genoa → Turin (theo thứ tự thế hệ, từ thấp → cao)
  • Intel: Broadwell → Skylake → Cascade Lake → Ice Lake → Sapphire Rapids → Emerald Rapids → Granite Rapids
  • ARM: Ampere Altra → AmpereOne → AmpereOne M / AWS Graviton2 → Graviton3 → Graviton4 / Google Axion / Azure Cobalt 100
  • Các loại CPU đời cũ có hiệu năng thấp nhưng do chi phí vận hành nên thậm chí còn bị tính giá đắt hơn, vì vậy nên nâng cấp lên thế hệ mới nhất nếu có thể

Kết quả hiệu năng đơn luồng

  • AMD EPYC Turin đứng đầu toàn bảng; mức vượt trội này là lần đầu tiên xuất hiện trong lịch sử loạt benchmark
    • AWS C8a (Turin, SMT tắt) là cấu hình Turin nhanh nhất
    • GCP c4d có độ dao động hiệu năng lớn, còn n4d rẻ hơn và ổn định hơn
  • Intel Granite Rapids: giải quyết tình trạng hiệu năng thiếu ổn định của Emerald Rapids do phụ thuộc boost clock và tranh chấp node, mang lại hiệu năng cao hơn và nhất quán hơn
    • Trên GCP, Emerald Rapids giảm hiệu năng rõ rệt khi tải tăng; GCP còn cung cấp riêng chế độ "hiệu năng ổn định" cho trường hợp này (tắt boost)
  • Ở phe ARM, Google Axion đạt hiệu năng đơn luồng ngang ngửa EPYC Genoa, đứng đầu nhóm máy chủ ARM
    • Azure Cobalt 100 nằm giữa Graviton3 và Graviton4
    • Ampere AmpereOne M cải thiện nhẹ, đạt mức tương đương AWS Graviton3
  • Trong nhóm nhà cung cấp giá rẻ, DigitalOcean có xu hướng tụt hiệu năng; Akamai và Hetzner cho kết quả tốt với instance Milan nhưng không bảo đảm mức hiệu năng khi tạo instance

Hiệu năng đa luồng và khả năng mở rộng

  • Khả năng mở rộng (Scalability): các instance ARM và shared CPU đạt gần ~100%, tức 2vCPU cho hiệu năng gần gấp đôi 1 vCPU
    • Instance x86 dùng SMT thấp hơn 100%; càng gần 50% thì lợi ích hiệu năng càng ít
    • AMD vốn có hiệu quả SMT cao hơn Intel, còn Intel có xu hướng cải thiện từ Ice Lake trở đi
    • Instance Turin của Akamai ghi nhận khả năng mở rộng cao bất thường là 71.9% dù có SMT (chưa rõ nguyên nhân)
    • Các instance tắt SMT: AWS C7a (Genoa), C8a (Turin), GCP t2d (Milan)
  • Mạnh nhất ở đa luồng: AWS C8a dùng Turin và tắt SMT áp đảo toàn bộ biểu đồ
    • Google Axion đạt mức tương đương Genoa C7a, vốn từng đứng đầu trong so sánh trước đó
    • Graviton4 bám sát, tiếp theo là Cobalt 100
    • Nhóm cuối gồm Intel Broadwell/Skylake/Ice Lake và AMD Rome
  • 7zip: Turin nhìn chung đứng đầu, nhưng Axion và Graviton4 vượt Turin ở phần giải nén; Cobalt 100 có hiệu năng giải nén cao nhất riêng lẻ
  • NGINX (100 connections): AWS C8a nhanh gần gấp đôi hạng 2, Granite Rapids cũng cho kết quả rất tốt
  • FFmpeg H264: Turin đứng đầu; Granite Rapids bám sát ở đơn luồng; khi dùng 2 lõi đầy đủ, Axion vượt hầu hết instance SMT (đơn lõi vật lý), ngoại trừ Turin
  • OpenSSL RSA4096(AVX512): AMD vượt Intel ngay cả trong phần mở rộng do Intel khởi xướng; cả Turin và Genoa đều mạnh hơn mọi thế hệ Intel; Granite Rapids không cải thiện nhiều so với Ice Lake; ARM và AMD đời cũ không hỗ trợ AVX512 nên thua cả Intel Skylake trở xuống

So sánh hiệu năng/giá on-demand

  • Đơn luồng: Hetzner (đặc biệt nếu tính cả shared core) và Oracle dẫn đầu, theo sau là GCP n4d (Turin) và Linode
    • AWS có hiệu năng/chi phí tệ nhất ở giá on-demand; Turin là lựa chọn tốt nhất trong AWS nhưng các thế hệ cũ xếp cuối bảng
  • Đa luồng: instance ARM của Oracle (AmpereOne M) đứng đầu, shared core của Hetzner và Linode bám sát
    • Google Axion, Azure Cobalt 100 và droplet của DigitalOcean tạo thành nhóm tier 2
  • Shared core của Hetzner (CPX22, CAX11) có mức giá trên mỗi đơn vị hiệu năng vượt trội hoàn toàn so với các nhà cung cấp khác, dù bị hạn chế về khả dụng (chỉ có ở region EU·AP và thường xuyên hết hàng)

So sánh hiệu năng/giá khi đặt trước

  • Đặt trước 1 năm: Turin của GCP (n4d·c4d) tiệm cận Oracle; Azure Cobalt 100 và Genoa cũng có hiệu năng/chi phí cạnh tranh
    • Trên AWS, họ C8a là lựa chọn tốt nhất; có thể áp dụng mức giá 1 năm mà không cần đặt trước thông qua bên thứ ba như DoIT Flexsave
  • Đặt trước 3 năm, đơn luồng: Turin của GCP nhỉnh hơn đôi chút so với VM chuyên dụng của Oracle và Hetzner; Azure cũng cạnh tranh tốt với Cobalt 100 và Genoa
    • AWS khi cam kết 3 năm vẫn cho hiệu năng/chi phí tốt hơn Akamai và DigitalOcean
  • Đặt trước 3 năm, đa luồng: Azure Cobalt 100 bất ngờ đứng số 1; theo sau là ARM của GCP và OCI; Turin của AWS và GCP cũng ở gần nhóm đầu

So sánh hiệu năng/giá của spot/preemptible instance

  • Spot instance được xem là cách duy nhất trên đám mây để tiến gần chi phí vận hành máy chủ riêng
    • Cảnh báo trước khi thu hồi instance: AWS·OCI 2 phút, Azure·GCP 30 giây
    • Oracle cố định mức giảm 50%, còn 3 hãng kia biến động mạnh theo region và thời điểm
  • Spot đơn luồng: Turin của Oracle luôn đứng đầu nhờ mức giảm giá cố định; GCP và Azure cho mức giảm sâu nhất (Genoa, Cobalt 100)
    • Khi dùng spot, có thể đạt hiệu năng trên mỗi đô la cao hơn khoảng 2 lần so với đặt trước 3 năm
  • Spot đa luồng: Azure Cobalt 100 đứng số 1, OCI AmpereOne M đứng số 2; trên GCP, t2d (Milan) có thể là lựa chọn hiệu năng/chi phí tốt nhất tùy region; AWS chỉ vừa đủ lọt Top 10 nhờ Turin

Đánh giá tổng thể theo từng nhà cung cấp đám mây

  • AWS: hiệu năng ARM cao nhất toàn cục đã mất vào tay Google Axion khi Graviton5 còn ở private beta, nhưng x86 mạnh nhất vẫn được giữ bởi C8a(Turin) không SMT; giá on-demand cao hơn đối thủ nhưng có thể cạnh tranh nếu tận dụng spot, đặt trước và Flexsave; mức giảm giá cho instance đời cũ thấp nên C8a vẫn là lựa chọn tốt nhất ngay cả ở spot
  • GCP: khuyến nghị dùng instance ARM thế hệ 4 (Axion c4a) và AMD (Turin n4d·c4d); n4d gần như có cùng hiệu năng với c4d nhưng rẻ hơn; Granite Rapids không thể dùng nếu không trả thêm chi phí local SSD (hiện chưa hỗ trợ min_cpu_platform); với spot, instance tối ưu thay đổi theo từng region
  • Azure: ARM tự phát triển Cobalt 100 có hiệu năng thấp hơn đôi chút so với Google Axion nhưng giá cạnh tranh; Turin và Granite Rapids vẫn ở private preview tại thời điểm viết; bất ngờ đứng đầu ở hạng mục đặt trước 3 năm đa luồng
  • Oracle: rất khuyến nghị VM ARM miễn phí 4 lõi (A1) cho dự án nhỏ; instance trả phí cũng có hiệu năng/chi phí on-demand tương đương mức giá đặt trước 1–3 năm của Big 3; AmpereOne M(A4) và Turin E6 lần lượt là lựa chọn tốt nhất cho ARM và x86; A4 bị giới hạn region khả dụng
  • Akamai(Linode): Linode shared core có hiệu năng/chi phí on-demand chỉ xếp sau Hetzner và Oracle; không thể chọn CPU khi tạo nên cần tự kiểm tra có phải Milan hay không (/proc/cpuinfo); instance chuyên dụng có thể chỉ định thế hệ (G8=Turin) nhưng hiệu năng đơn luồng lại thấp bất thường
  • DigitalOcean: tụt hạng hiệu năng do lâu không nâng cấp và còn có hiện tượng quá tải; vẫn giữ ưu điểm tiện lợi như nâng cấp instance đơn giản (đổi loại chỉ với một cú nhấp)
  • Hetzner: có tiếng tốt với người dùng lâu năm, không overprovision quá mức (trừ CX23); shared core CPX22(Genoa) và CAX11(ARM Altra) có hiệu năng/chi phí tốt nhất nhưng chỉ có ở region EU·AP và hay hết hàng; dedicated core CCX13 có chênh lệch hiệu năng tùy datacenter

Khuyến nghị cuối cùng

  • Ngân sách thấp nhất: Oracle free tier → Hetzner (nếu chấp nhận region EU·AP) → spot instance (Azure ARM, Oracle·GCP ARM/AMD)
  • Hiệu năng/chi phí tốt nhất cho CPU không chia sẻ (on-demand): Oracle AmpereOne M A4 hoặc Turin E6; nếu đặt trước thì Azure Dpls_v6, GCP c4a/n4d, AWS C8a cũng cạnh tranh tốt
  • Hiệu năng cao nhất: AWS C8a (Turin không SMT) là instance đơn mạnh nhất; mọi instance của các nhà cung cấp lớn dùng Turin tạo thành tier ngay phía sau

1 bình luận

 
GN⁺ 2026-03-08
Ý kiến trên Hacker News
  • Chúng tôi đã chạy các bài kiểm thử quy mô lớn trong CI. Dùng instance AMD Turin của GCP, và trong bài viết cũng nói đây là một trong những lựa chọn nhanh nhất
    Nhưng điều đáng ngạc nhiên là AMD EPYC 4565p lại có hiệu năng đơn nhân nhanh hơn cloud Turin tới 2 lần
    Trên GCP, bài test mất 2 phút, còn trên 4565p chỉ mất 1 phút. Trên cloud giữ boost 4.1GHz, còn máy của tôi giữ boost 5.1GHz
    GCP là 8vCPU với giá $130/tháng (spot instance), trong khi 4565p của tôi là CPU $500 với 32vCPU, cả bộ máy còn chưa tới $2,000
    Tôi nghĩ với CI thì tự đặt máy lên rack hiệu quả hơn nhiều. Chỉ vài tháng là bù được chi phí cloud, mà hiệu năng còn gấp đôi

    • Ở Hetzner, cấu hình 8vCPU chỉ khoảng €10~€48/tháng, còn €104 thì có thể thuê Ryzen 9 7950X3D (gần như tương đương 4565p) + 128GB DDR5 + 2 SSD 2TB
      Biên lợi nhuận của các công ty châu Âu thấp hơn Mỹ rất nhiều. Nếu tính đơn giản thì mất 17 tháng, còn nếu tính cả chi phí colocation thì phải khoảng 8 năm mới hòa vốn
    • Nếu bộ máy $2,000 mà tốn $100/tháng tiền colo thì cách tính vài tháng là hòa vốn rõ ràng không hợp lý
      Kể cả colo miễn phí thì cũng phải hơn 1 năm
    • Trước đây tôi từng vận hành một trang web so sánh giá (baremetalsavings.com)
      Dạo này các dev thấy bare metal là thứ khó nhằn, nhưng thật ra cloud cũng phức tạp tương đương hoặc còn hơn
    • Datapacket và OVH cũng cung cấp 4565p. CPU này là viên ngọc ẩn. Với hầu hết workload, nó thuộc nhóm tốt nhất cả về hiệu năng lẫn giá/hiệu năng
    • Blacksmith.sh cũng là một khái niệm tương tự. Điểm khác là không phải tự host phần cứng
  • Tôi làm ở đội Google Compute Engine VM. Bài này là một benchmark được tổng hợp rất tốt

    1. Turin là quái vật thực thụ
    2. Về hiệu năng trên giá thành, Hetzner rất xuất sắc, đặc biệt với các dự án nhỏ
    3. DigitalOcean vẫn còn khá nhiều phần cứng cũ, nhưng gần đây đã làm mới một phần bằng bộ xử lý Xeon thế hệ 5
    • Hetzner thực sự tỏa sáng ở mảng máy chủ chuyên dụng
  • Genoa đã là một bước nhảy lớn so với Milan, còn Turin còn lớn hơn nữa. AMD dạo này làm quá tốt. Xin gửi lời tán dương tới đội ngũ của Lisa Su

    • Nhưng AMD vẫn yếu ở hệ sinh thái phần mềm. Đó là lý do NVIDIA trở thành công ty nghìn tỷ đô
      Các bộ tăng tốc như MI300 có thông số rất cạnh tranh, nhưng stack phần mềm yếu nên chẳng mấy ai quan tâm
  • Vultr và HostHatch cũng là những lựa chọn đáng cân nhắc

  • Tôi đã thử so sánh vài thứ bằng PC gaming của mình (9800X3D, 8 nhân 5.2GHz)
    Kết quả 7-Zip và Geekbench cho thấy CPU desktop nhanh hơn hẳn cả đơn luồng lẫn đa luồng
    Hiệu năng đơn luồng của C8A ổn, nhưng hiệu năng bộ nhớ thì rất tệ

  • Tôi tò mò không biết có dễ rời Oracle Cloud hay không. Benchmark cho kết quả tốt, nhưng tôi nghe nói lock-in về giấy phép rất nặng

    • Tôi là người đã viết bài đó. Tôi tuyệt đối không khuyên dùng Oracle. Chính sách giá và lock-in quá nặng
      Dù vậy, vì chi phí quá rẻ nên tôi vẫn để các dự án nhỏ trên Oracle Cloud. Không dùng DBaaS, chỉ dùng VM Linux thuần
    • Tôi đã dùng Oracle Cloud cho công việc suốt vài năm. Nếu không dùng DBaaS độc quyền thì rời đi còn khá dễ, và traffic egress cũng miễn phí
      Chỉ có điều UX thật sự khủng khiếp
    • Tôi đăng ký trial, nhưng chỉ vài ngày sau tài khoản bị đóng và VM bị xóa. Tôi thậm chí không thể thêm thông tin thanh toán
      Đội sales liên tục liên hệ nhưng không giải quyết được gì. Trên Reddit cũng có nhiều người gặp trải nghiệm tương tự
    • Tôi từng dùng free tier, việc tạo tài khoản rất rắc rối và nếu mức sử dụng thấp thì instance bị tắt. Giao diện nhìn chung rất lỗi thời
    • Mỗi lần đăng nhập Oracle Cloud tôi lại nghĩ: “Tại sao mình còn phải đăng nhập vào đây nhỉ?”
  • Tôi vẫn đang dùng CPU ROME EPYC mua với giá vài trăm đô. Hiệu quả điện năng không tốt, nhưng hiệu năng đa luồng vượt 9950X

  • Thật vui khi thấy đường truyền internet cáp quang 250/250 giá 36 euro mà tôi đang trả vẫn còn khá cạnh tranh

  • Có vẻ sở hữu phần cứng riêng vẫn rẻ hơn nhiều. Tôi nghĩ điều này đặc biệt đúng với môi trường dev/test
    Tôi không hiểu tại sao các công ty lớn, dù chi phí vốn thấp hơn AWS, vẫn lại lên cloud

    • Khi cloud mới xuất hiện, có khi mất 3 tháng để đặt được server, và chi phí điện, làm mát, nhân sự vận hành rất lớn
      Nhưng giờ đây cấu trúc chi phí còn bao gồm cả chi phí kỹ sư AWS, nên trên thực tế vẫn rất đắt
      Server hiện nay lên tới 288 nhân, nên hoàn toàn có thể vận hành với phần dư công suất tự có
    • Tôi đã chuyển hai khách hàng sang colocation và mức tiết kiệm chi phí là cực kỳ ấn tượng.
      Chạy workload chính trên phần cứng riêng, đồng thời dùng thêm cloud storage là hoàn toàn khả thi
    • Cloud hiển nhiên luôn đắt hơn phần cứng tự sở hữu. Nhưng người ta chọn nó vì đa vùng, sự tiện lợi trong vận hành
      Trên thực tế, lý do lớn hơn lại là “vì ai cũng làm thế”
    • Cũng có rất nhiều bài viết kiểu “chúng tôi chuyển từ AWS sang Hetzner và giảm 89% chi phí”
      Xem bài liên quan
    • Nhưng tự duy trì và cập nhật phần cứng trực tiếp có chi phí vận hành lớn, nên sự linh hoạt của cloud vẫn rất hấp dẫn
  • Thật mỉa mai khi Oracle trông như một lựa chọn có giá/hiệu năng tốt, nhưng có lẽ không thể tin điều đó lâu dài