S3 Express là tất cả những gì bạn cần
(warpstream.com)- Lớp lưu trữ độ trễ thấp mới của AWS, "S3 Express One Zone", đang thu hút sự chú ý trong cộng đồng hạ tầng dữ liệu
- Tốc độ truy cập dữ liệu nhanh hơn 10 lần, chi phí API request rẻ hơn 50%. Có thể xử lý hàng triệu request mỗi phút
- Lớp lưu trữ S3 Express đắt hơn 8 lần mỗi GiB so với S3 Standard hiện có, nên không phù hợp làm nơi lưu trữ "chính" cho các hệ thống dữ liệu quy mô lớn
- Chi phí cho các thao tác API rẻ hơn 50%, nhưng không phải là cực kỳ rẻ, nên vẫn không phù hợp với những workload trước đây vốn không thực tế vì chi phí của S3 API
- S3 Express tính phí theo GiB cho mọi thao tác API (ghi + đọc) vượt quá 512 KiB
- Nói cách khác, mọi thao tác API đều được cung cấp 512 KiB băng thông "miễn phí", và chỉ trả phí khi vượt quá mức này
- Tuy nhiên, vì đây là lớp lưu trữ One Zone, các hệ thống dữ liệu phải tự sao chép dữ liệu sang hai AZ để phòng trường hợp một AZ đơn lẻ gặp sự cố
- Chi phí ghi dữ liệu hai lần vào hai AZ tương đương với chi phí sao chép dữ liệu thủ công ở tầng ứng dụng
Cơ hội mới cho hạ tầng dữ liệu hiện đại
- Lớp lưu trữ mới mang lại cơ hội mới để điều chỉnh giữa độ trễ thấp và chi phí cao, hoặc độ trễ cao và chi phí thấp, với cùng một kiến trúc và cùng một code
- Giờ đây, mọi hệ thống dữ liệu hiện đại không còn cần được thiết kế phụ thuộc vào tính sẵn sàng của đĩa cục bộ hay block storage (EBS), mà có thể được xây dựng hoàn toàn trên object storage
- Dữ liệu có thể dễ dàng được lưu trong bucket S3 Express độ trễ thấp rồi được chuyển không đồng bộ sang bucket S3 Standard, và phần lớn các hệ thống dữ liệu hiện đại đã có sẵn khả năng nén nên việc "phân tầng lưu trữ" về cơ bản là miễn phí
Ý kiến của GN⁺
Điểm quan trọng nhất của bài viết này là triển vọng về những thay đổi mà lớp lưu trữ mới S3 Express One Zone của AWS có thể mang lại cho hạ tầng dữ liệu. Lớp lưu trữ này mở ra những cơ hội mới có thể cải thiện mạnh mẽ chi phí và hiệu năng của các hệ thống dữ liệu, từ đó có thể tạo ra sự đổi mới trong cách quản lý và lưu trữ dữ liệu. Đặc biệt, khả năng xây dựng toàn bộ hệ thống dữ liệu xoay quanh object storage sẽ là một lựa chọn hấp dẫn với nhiều doanh nghiệp và nhà phát triển. Những thay đổi này được kỳ vọng sẽ giúp tương lai của hạ tầng dữ liệu trở nên linh hoạt hơn và hiệu quả chi phí hơn.
3 bình luận
Tôi tò mò không biết nó sẽ được օգտագործ dụng như thế nào.
Ngay hôm qua tôi vừa tìm lại WarpStream nên đính kèm link nhé
https://vi.news.hada.io/topic?id=10234
Ý kiến Hacker News
Hầu hết các hệ thống lưu trữ/cơ sở dữ liệu production dựa trên S3 đều bỏ ra nỗ lực đáng kể để xây dựng tầng cache SSD/bộ nhớ nhằm đạt hiệu năng đủ tốt.
Chi phí lưu trữ AWS S3 Express cao gấp 8 lần S3 Standard, nhưng đây không phải vấn đề với các hệ thống lưu trữ dữ liệu hiện đại.
Vài tuần trước, Quickwit, công cụ tìm kiếm, đã thử nghiệm S3 Express.
Bổ sung thêm ngữ cảnh, WarpStream đang xây dựng một hệ thống streaming tương thích Kafka dùng S3 làm object store.
Tôi đã giải quyết vấn đề bằng cách cache file trong Redis trước khi upload lên S3 từ máy local.
Tôi không hiểu vì sao EFS vượt trội hơn S3 rất nhiều mà lại không được chú ý.
Tôi tự hỏi liệu cụm từ "X is all you Need" có phải lần đầu được dùng trong bài báo "Attention is all you need" hay không.
Nếu đây là S3 độ trễ thấp được viết bằng Rust, thì sau vài năm phát triển cuối cùng nó cũng đã ra mắt.
Tôi tự hỏi có những trường hợp sử dụng nào sẽ được cải thiện hiệu năng nhờ tầng S3 Express mới, và liệu chi phí tăng thêm gấp 8 lần có xứng đáng hay không.
Nhiều triển khai S3 trông đơn giản như chỉ là tải xuống minh bạch về đĩa, nhưng trên thực tế đó không phải là việc "dùng mạng như một ổ đĩa".