- Bài viết này giới thiệu WarpStream, một nền tảng streaming dữ liệu tương thích với giao thức Kafka được xây dựng trực tiếp trên S3.
- WarpStream được cung cấp dưới dạng một binary Go stateless duy nhất, loại bỏ nhu cầu quản lý đĩa cục bộ, tái cân bằng broker và vận hành ZooKeeper.
- Nền tảng này giảm đáng kể chi phí hạ tầng bằng cách stream dữ liệu trực tiếp vào S3, rẻ hơn Kafka trên đám mây từ 5-10 lần.
- Bài viết phê phán mức độ phù hợp của Kafka với các workload hiện đại, nhấn mạnh chi phí băng thông liên AZ cao và overhead vận hành.
- Kiến trúc của WarpStream khác với Kafka. Thay vì broker, nó có các "agent" stateless có thể đóng vai trò "leader" cho bất kỳ topic nào, commit offset cho bất kỳ consumer group nào, hoặc hoạt động như coordinator của cluster.
- Trong WarpStream, toàn bộ storage được offload sang object storage như S3, cho phép mở rộng dễ dàng và khôi phục nhanh khi có sự cố.
- WarpStream tách biệt data và metadata, lưu metadata của mọi "virtual cluster" trong một cơ sở dữ liệu metadata tùy chỉnh.
- Nền tảng này giúp giảm tổng chi phí của hầu hết workload Kafka từ 5-10 lần, nhưng có độ trễ cao hơn với P99 cho request produce khoảng 400ms và khoảng 1 giây từ producer đến consumer.
- WarpStream hiện đang ở giai đoạn developer preview và vẫn chưa sẵn sàng cho sử dụng production.
- Những người tạo ra WarpStream cho rằng developer UX của Kafka là một vấn đề, đặc biệt là abstraction cấp thấp của partition. Họ dự định giải quyết điều này trong các bản cập nhật tương lai của WarpStream.
- Bài viết kết thúc bằng lời mời độc giả dùng thử WarpStream và gửi phản hồi.
1 bình luận
Ý kiến trên Hacker News