- Databricks đã đồng ý mua lại Neon, đơn vị cung cấp Postgres serverless lấy nhà phát triển làm trung tâm
- Neon cung cấp nền tảng cơ sở dữ liệu serverless được tối ưu cho nhà phát triển và các hệ thống AI nhờ kiến trúc tách biệt storage và compute
- Sau khi Neon được áp dụng, tỷ trọng cơ sở dữ liệu do các AI agent tạo ra đã tăng vọt từ 30% lên hơn 80%
- Databricks và Neon có chung triết lý mã nguồn mở và DNA đổi mới hạ tầng
- Ngay cả sau thương vụ, việc hỗ trợ nền tảng Neon và lộ trình hướng tới tương lai sẽ tiếp tục được tăng cường bằng nguồn lực của Databricks
Thông báo mua lại và ý nghĩa
- Databricks đã đồng ý mua lại Neon, đơn vị cung cấp Postgres serverless lấy nhà phát triển làm trung tâm
- Các đồng sáng lập Neon là một trong số rất ít chuyên gia hàng đầu thế giới có thể thiết kế Postgres với cấu trúc tách biệt hoàn toàn giữa storage và compute
- Đội ngũ này đã tập trung xây dựng nền tảng Postgres serverless để hỗ trợ quy mô lớn cho nhà phát triển trong kỷ nguyên AI
Sứ mệnh đổi mới dựa trên Postgres
- Khoảng 4 năm trước, các đồng sáng lập Neon đã cùng chung mục tiêu đổi mới cấu trúc cơ sở dữ liệu lỗi thời
- Mục tiêu cốt lõi như sau
- Dự đoán Postgres sẽ trở thành tiêu chuẩn thực tế, và xây dựng tầm nhìn về một nền tảng serverless
- Tập trung vào tốc độ để nhà phát triển có thể tạo instance mới chỉ trong vài giây
- Hướng tới giải quyết nỗi lo over/under provisioning thông qua tự động mở rộng cơ sở dữ liệu và đơn giản hóa vận hành
- Hỗ trợ branching và forking tức thì để việc kiểm thử và thử nghiệm cơ sở dữ liệu trở nên dễ dàng hơn
- Đội ngũ Neon đã đạt được các mục tiêu trên bằng cách xây dựng kiến trúc cho phép storage và compute mở rộng độc lập
- Sau khi ra mắt, các nhà phát triển đánh giá cao tốc độ, sự đơn giản và tính năng branch/fork theo kiểu Git
Thay đổi trong kỷ nguyên AI agent
- Sau GA của Neon, AI agent chiếm 30% tổng số cơ sở dữ liệu được tạo, và gần đây con số này đã tăng lên hơn 80%
- AI agent bắt đầu có những yêu cầu tương tự nhà phát triển
- Thế mạnh của Neon gồm
- Hệ sinh thái mã nguồn mở Postgres: các LLM mới nhất được huấn luyện trên dữ liệu Postgres, nên AI agent rất thành thạo khi sử dụng Neon
- Tốc độ cao: vì yêu cầu nhanh hơn con người, việc provisioning instance siêu nhanh là điều thiết yếu
- Mở rộng linh hoạt và chi phí: nhờ kiến trúc serverless tách biệt, chi phí cực thấp và có thể hỗ trợ số lượng lớn AI agent
- Branching và forking: giúp AI agent dễ dàng thử nghiệm/xác minh trong các tình huống thay đổi liên tục
DNA chung của Databricks và Neon
- Các nhà sáng lập Nikita Shamgunov, Heikki Linnakangas, Stas Kelvich là những chuyên gia công nghệ cơ sở dữ liệu nổi tiếng trong ngành
- Họ có kinh nghiệm phong phú và sự sáng tạo riêng biệt từ SingleStore, vai trò Postgres committer và nhiều lĩnh vực khác
- Cả Databricks và Neon đều coi trọng đổi mới công nghệ tiên tiến ở tầng hạ tầng và các giá trị mã nguồn mở
- Apache Spark và Postgres đều có mối liên hệ ở chỗ là các dự án mã nguồn mở khởi nguồn từ UC Berkeley
Tầm nhìn tương lai và lợi ích cho người dùng
- Thị trường cơ sở dữ liệu OLTP (quy mô khoảng 100 tỷ USD) hiện vẫn chủ yếu dựa trên các sản phẩm từ nhiều thập kỷ trước
- Giờ là lúc nhà phát triển và AI agent dẫn dắt đổi mới
- Databricks và Neon hướng tới nền tảng DB thân thiện nhất với nhà phát triển và AI agent
- Khách hàng và đối tác Neon hiện tại có thể kỳ vọng vào sự hỗ trợ và đổi mới liên tục cũng như việc hiện thực hóa lộ trình sản phẩm
- Với nguồn lực của Databricks, việc tăng cường nền tảng và tăng trưởng ổn định sẽ được đảm bảo
- Tại Data + AI Summit (San Francisco, ngày 9–12 tháng 6), hai bên sẽ chia sẻ chi tiết hơn về tầm nhìn tương lai
1 bình luận
Ý kiến trên Hacker News
(1) AWS RDS thì chúng tôi đã dùng rồi, nhưng đắt và có vấn đề về mở rộng cũng như vận hành
(2) AWS Aurora giải quyết được một phần vấn đề vận hành nhưng kéo theo nhược điểm khác, và cũng có những giới hạn tương tự các lựa chọn Postgres tương thích wire khác
(3) CockroachDB rất thú vị, nhưng có vấn đề về tương thích với toolchain và mức độ tương thích sâu; vào thời điểm đó nó vẫn là mã nguồn mở
(4) Neon khi đó còn có vẻ non, nên tôi chưa triển khai, nhưng nó rất đáng chú ý và có vẻ có thể giải quyết được nhiều vấn đề
(5) Yugabyte cũng là công nghệ thú vị, nhưng cũng có nhiều vấn đề tương thích khác nhau
Tôi cũng từng cân nhắc tự host Postgres, nhưng gánh nặng tự vận hành Kubernetes và Postgres là quá lớn. Các tính năng tự sao chép và tự vận hành khi đó vẫn còn chưa chín muồi, còn việc unload/reload toàn bộ dữ liệu khi nâng cấp thì cực kỳ phiền phức. Mở rộng hay tự động hóa đều không hề dễ