1 điểm bởi GN⁺ 2024-09-14 | 1 bình luận | Chia sẻ qua WhatsApp

NAS ZFS 71 TiB không có ổ đĩa nào hỏng suốt 10 năm

  • Phần cứng

    • NAS ZFS 71 TiB gồm 24 ổ đĩa 4 TB
    • Trong 10 năm chưa từng có một ổ đĩa nào hỏng
    • Hiện đang dùng bo mạch chủ và bộ nguồn thứ hai
  • Quản lý ổ đĩa

    • Các ổ HGST 4 TB đã được sử dụng khoảng 6000 giờ trong 10 năm
    • Tắt máy chủ khi không sử dụng giúp kéo dài tuổi thọ ổ đĩa
    • Sử dụng script để bật và tắt máy chủ từ xa
    • Để tiết kiệm năng lượng và kéo dài tuổi thọ ổ đĩa, máy chủ được tắt theo mặc định
  • Thay bo mạch chủ

    • Đã thay bo mạch chủ vài năm trước do hỏng hóc
    • Gặp các vấn đề như không vào được BIOS và khởi động thất bại
    • Mua cùng mẫu bo mạch chủ trên Ebay để giải quyết vấn đề
  • ZFS

    • ZFS hoạt động ổn định trên nhiều hệ điều hành mà không gặp vấn đề
    • Đã chạy zpool scrub vài lần nhưng không có lỗi checksum
    • ZFS rất hiệu quả trong việc ngăn ngừa mất dữ liệu
  • Quản lý tiếng ồn

    • Tốc độ quạt mặc định rất cao nên tiếng ồn lớn
    • Viết script điều chỉnh tốc độ quạt theo nhiệt độ
    • Dùng bộ điều khiển PID để điều chỉnh tốc độ quạt và tiếng ồn
  • Mạng

    • Ban đầu sử dụng bộ điều khiển mạng gigabit
    • Sau khi chuyển sang thẻ Infiniband đã đạt tốc độ truyền 700 MB/s
    • Hiện đang dùng thẻ Ethernet 10Gbit
  • Bộ nguồn

    • Khi khởi động, tất cả ổ đĩa cùng spin-up nên tiêu thụ 600W điện năng
    • Bộ nguồn đôi khi ngắt điện trong lúc khởi động
  • Ngừng sử dụng UPS

    • UPS tiêu thụ thêm điện nên đã ngừng sử dụng
    • Chấp nhận rủi ro mất hệ thống do vấn đề điện năng
  • Sao lưu

    • Dữ liệu quan trọng được sao lưu ba lần
    • Dữ liệu không quan trọng thì không sao lưu
    • Ngăn ngừa mất dữ liệu bằng cách thay thế phần cứng và dùng ZFS
  • Kế hoạch tương lai

    • Hiện tại chưa có kế hoạch mở rộng thêm dung lượng lưu trữ
    • Có sẵn bo mạch chủ, CPU, bộ nhớ và thẻ HBA dự phòng
    • Kích thước ổ đĩa tăng lên có thể cho phép chuyển sang dạng máy nhỏ gọn hơn
    • Nếu hệ thống hỏng, cũng có thể sẽ từ bỏ thú vui chơi lưu trữ

Tóm tắt của GN⁺

  • Bài viết chia sẻ kinh nghiệm vận hành một NAS ZFS 71 TiB suốt 10 năm mà không có ổ đĩa nào hỏng
  • Việc tắt máy chủ khi không sử dụng giúp kéo dài đáng kể tuổi thọ ổ đĩa
  • ZFS rất hiệu quả trong việc ngăn ngừa mất dữ liệu, và có thể giảm tiếng ồn bằng cách điều chỉnh tốc độ quạt
  • Tác giả đã sử dụng nhiều loại card mạng khác nhau để tăng tốc độ truyền mạng
  • Bài viết cũng chia sẻ kinh nghiệm về chiến lược sao lưu và quản lý bộ nguồn

1 bình luận

 
GN⁺ 2024-09-14
Ý kiến trên Hacker News
  • Chủ yếu đang có thảo luận về ZFS và BTRFS, nhưng cũng tò mò không biết có ai đã dùng thử bcachefs chưa

    • bcachefs đã được đưa vào nhân Linux và có tính năng checksum toàn bộ
    • Có một tác giả coi trọng nghiêm túc trách nhiệm của hệ thống tệp
  • Câu hỏi về việc có lịch luân phiên ổ đĩa hay không

    • Đang dùng 24 ổ đĩa cùng một mẫu, có vẻ đều đến từ cùng một lô
    • Khả năng chúng hỏng cùng lúc cao hơn do mức độ hao mòn tương tự nhau
    • Lưu trữ đáng tin cậy là một việc khá khó nhằn
  • Có ý kiến phản biện rằng để ổ đĩa luôn bật có thể làm giảm hao mòn hơn so với việc tắt bật nguồn định kỳ

    • Thích để ZFS NAS chạy liên tục để kiểm tra dữ liệu thường xuyên
    • Trong 10 năm vận hành một hệ thống 4 ổ đĩa, đã có 2 ổ hỏng, nhưng đó không phải ổ đĩa cấp doanh nghiệp (WD Green)
  • Quạt lớn có thể đẩy nhiều không khí ngay cả ở RPM thấp và hiệu quả năng lượng cao

    • Oxide Computer nhấn mạnh rằng họ dùng quạt 80mm nên yên tĩnh và tiêu thụ ít điện
    • Ở các máy chủ khác, điện năng cho quạt có thể chiếm tới 25% tổng điện năng, còn ở đây chỉ khoảng 1%
  • Muốn nghe thêm nhiều câu chuyện về bộ sưu tập phim

    • Quan tâm đến cách chọn các mục ban đầu và những mục vẫn còn ở lại trong bộ sưu tập sau hơn 10 năm
  • Chấp nhận rủi ro mất hệ thống vì vấn đề điện

    • UPS giúp ngăn các lỗi hiếm do mất cân bằng điện năng
    • Việc thi công xây dựng hoặc sét đánh có thể gây ra đột biến điện áp
    • UPS sẽ tự hỏng trước để bảo vệ máy chủ khỏi bị hư hại
  • 24 ổ đĩa có thể mang lại lợi thế về hiệu năng, nhưng dùng NAS 6 khay với đĩa 18TB sẽ có nhiều lợi ích hơn về điện năng tiêu thụ, tiếng ồn, không gian, chi phí và độ tin cậy

  • Môi trường mà ổ đĩa hoạt động ảnh hưởng lớn đến tuổi thọ

    • Môi trường nhà ở biến động nhiều hơn trung tâm dữ liệu hoặc không gian văn phòng
    • Biến động nhiệt độ, độ ẩm và tác động của bụi là đáng kể
    • Trong môi trường sạch và ổn định, số lần ổ đĩa hỏng giảm đi rõ rệt
  • Bí quyết không phải là tắt ổ đĩa mà đơn giản chỉ là may mắn

    • Đang dùng ổ HGST 4TB 24/7 hơn 10 năm và chưa hỏng lần nào
    • Những người khác đã phải RMA nhiều lần với cùng loại ổ đó
  • Cũng có những ổ đĩa mà việc thay đổi chu kỳ nguồn điện là rủi ro

    • Điều này không phải lúc nào cũng tốt cho tất cả mọi người
    • Một số SSD cần được cấp nguồn định kỳ
    • Chu kỳ hoạt động của NAS nhiều khả năng đáp ứng được yêu cầu này
    • Chi phí điện ngày càng rẻ hơn
    • Tò mò không biết Backblaze có mô hình hóa thống kê tuổi thọ theo số lần bật/tắt nguồn của ổ đĩa hay không