2 điểm bởi GN⁺ 2025-11-18 | 1 bình luận | Chia sẻ qua WhatsApp
  • Nền tảng chạy mô hình AI Replicate gia nhập Cloudflare và sẽ tiếp tục hoạt động như một thương hiệu độc lập
  • API và dịch vụ mô hình hiện tại được giữ nguyên, nên các ứng dụng đang xây dựng sẽ tiếp tục hoạt động như cũ
  • Replicate cung cấp các công cụ nền tảng và lớp trừu tượng cho phát triển AI, và dự kiến sẽ tích hợp với Developer Platform của Cloudflare
  • Có kế hoạch tận dụng hạ tầng như Workers, Durable Objects, R2, WebRTC của Cloudflare để mở rộng các khả năng điều phối mô hình và thực thi thời gian thực/tại biên
  • Thông qua hợp tác giữa hai bên, mục tiêu là trở thành nền tảng cơ bản cho phát triển ứng dụng AI

Tổng quan về việc Replicate gia nhập Cloudflare

  • Replicate gia nhập Cloudflare nhưng sẽ tiếp tục hoạt động như một thương hiệu độc lập
    • Dịch vụ sẽ nhanh hơn, có thêm nhiều tài nguyên hơn và dự kiến tích hợp với Developer Platform của Cloudflare
  • Không có thay đổi về API, các mô hình và ứng dụng hiện có vẫn hoạt động như cũ
    • Không ảnh hưởng đến các mô hình đang sử dụng hay các dịch vụ đã xây dựng

Nền tảng kỹ thuật của Replicate

  • Replicate xây dựng các thành phần nền tảng (primitives) cho AI
    • Hỗ trợ để nhà phát triển có thể sử dụng AI mà không cần hiểu cấu trúc nội bộ phức tạp
  • Cog là một công cụ mã nguồn mở, định nghĩa định dạng chuẩn của mô hình
  • Nền tảng Replicate cung cấp môi trường để chia sẻ mô hình và chạy chúng qua API
    • Chuẩn hóa cách định nghĩa, xuất bản, thực thi mô hình cũng như cách dữ liệu vào/ra được xử lý

Tầm nhìn như một hệ điều hành AI dựa trên đám mây

  • Lớp trừu tượng này tương tự với các thành phần cấp thấp của hệ điều hành
    • Nó chạy trên đám mây và cần GPU cùng khả năng mở rộng cụm
    • Được mô tả bằng khái niệm “mạng lưới chính là máy tính
  • Cloudflare được nhắc đến như công ty có hạ tầng mạng phù hợp nhất cho điều này

Kết hợp với hạ tầng Cloudflare

  • Cloudflare đã xây dựng những thành phần khác của hệ điều hành
    • Workers: chạy agent và mã kết nối
    • Durable Objects: quản lý trạng thái
    • R2: lưu trữ tệp
    • WebRTC: truyền phát media
  • Trên nền tảng đó, Replicate có kế hoạch phát triển các khả năng cấp cao hơn như điều phối mô hình, xây dựng agent, chạy mô hình thời gian thực và tại biên

Mục tiêu và ý nghĩa của sự hợp tác

  • Cloudflare được đánh giá là một trường hợp điển hình đã phát triển thành doanh nghiệp quy mô lớn nhờ xây dựng các sản phẩm thân thiện với nhà phát triển
  • Replicate đã sử dụng Cloudflare từ những ngày đầu để xây dựng nguyên mẫu
  • Hai bên cùng hướng tới mục tiêu trở thành nền tảng cơ bản cho phát triển ứng dụng AI
  • Có thể xem thêm chi tiết trong bài công bố trên blog chính thức của Cloudflare

1 bình luận

 
GN⁺ 2025-11-18
Ý kiến trên Hacker News
  • Gửi lời chúc mừng tới Ben và cả nhóm
    Thương vụ này có vẻ là vụ thâu tóm đáng chú ý nhất của Cloudflare
    Trước đây họ chủ yếu mua các công ty bảo mật quy mô nhỏ như Area 1 Security

    • Thương vụ này tạo cảm giác Cloudflare đang mở rộng ra khỏi trọng tâm mạng lưới hiện có để tiến gần hơn tới mô hình hosting truyền thống. Dĩ nhiên, các dịch vụ như Workers hay R2 trước đó cũng đã làm mờ ranh giới này rồi
    • Có lẽ là vậy. Danh sách các thương vụ mua lại của Cloudflare có thể xem trên blog chính thức. Có BastionZero, Kivera, Baselime, PartyKit, Area 1, Vectrix, Zaraz, Linc, S2 Systems, Neumob, Eager, CryptoSeal, StopTheHacker, v.v.
    • Tuy vậy, đây có thể không phải là một thương vụ thâu tóm điển hình theo kiểu nhà đầu tư hay đội ngũ thu được khoản lợi lớn. Không có giá trị công bố, và thị trường hạ tầng cho việc ‘chạy mô hình’ vốn đã cạnh tranh rất khốc liệt
  • Xét từ góc độ tích hợp AI, tôi đang kỳ vọng Cloudflare có thể giúp các mô hình của Replicate đạt hiệu năng cao với chi phí thấp
    Replicate có nhiều tùy chọn triển khai autoscaling, nhưng để giữ trạng thái boot sẵn thì chi phí khá cao, nên với nhà phát triển cá nhân đây là gánh nặng
    Nhờ hạ tầng của Cloudflare, có vẻ khả năng mô hình được giữ ở trạng thái đã khởi động sẵn sẽ cao hơn
    Gần đây tôi đặc biệt quan tâm đến các mô hình giọng nói sang giọng nói (ví dụ: sensefvg/InteractiveOmni-8B, Qwen 2.5 Omni, OpenAI Realtime, Gemini Live)
    Tôi dự đoán các sản phẩm AI chủ lực sau này sẽ mặc định hỗ trợ đầu vào và đầu ra bằng giọng nói
    Replicate phản hồi rất nhanh, chẳng hạn chỉ sau một ngày kể từ khi có yêu cầu là đã đưa mô hình lên, thật sự rất tuyệt. Mong là lucataco đã nhận được phần thưởng xứng đáng

  • Với tư cách là khách hàng của Replicate, tôi rất vui với tin này
    Cloudflare có động lực đầu tư chiến lược vào lĩnh vực này, và sở hữu một đội ngũ marketing cùng bán hàng rất mạnh để giúp Replicate đạt được quy mô bền vững

  • Tôi đã tự hỏi đến bao giờ Cloudflare mới thực sự bước vào mảng AI, và lựa chọn này có vẻ hợp lý
    Mong đội ngũ phát triển đã nhận được tiền thưởng hoặc cổ phiếu từ thương vụ này

    • Thực ra Cloudflare đã vận hành Workers AI từ trước rồi. Chỉ là có khá nhiều mô hình cũ nên chưa tạo được tiếng vang lớn
      Việc mua lại Replicate có vẻ là lựa chọn tốt cho cả hai bên. Tuy vậy, để cạnh tranh với fal.ai thì họ sẽ cần năng lực cạnh tranh về giá
    • Nếu bạn nghĩ đây là lần đầu Cloudflare thử làm việc này thì là bạn đã bỏ sót khá nhiều
    • Cũng có ý kiến chỉ trích rằng “họ không tự đổi mới mà đi mua đối thủ”. Quan điểm này cho rằng họ dùng thâu tóm để che lấp thay vì giải quyết các vấn đề về cấu trúc nội bộ hay lãnh đạo
  • Về mặt kỹ thuật, độ tương thích giữa hai công ty là rất cao
    Thời còn làm ở AWS, tôi từng làm việc với đội Replicate và họ thực sự là một đội ngũ xuất sắc

  • Ban đầu tôi hơi bối rối vì tưởng Cloudflare đã mua Replicated, một startup làm công cụ on-premises

    • Cuối cùng được tóm lại bằng câu đùa: “cloud rốt cuộc cũng chỉ là on-premises của người khác”
  • Tôi tò mò không biết với văn hóa và lịch sử của Cloudflare, các thế mạnh về tài liệu, API và thiết kế của Replicate có còn được giữ nguyên không

    • Tôi nghĩ sẽ không có thay đổi lớn. Ngay cả blog của Replicate cũng đã nói rõ, và từ phía Cloudflare thì đó cũng là điều có lợi
      Gần đây Cloudflare đã công bố Omni cho AI inference, và cho biết họ đã đạt được kết quả giảm chi phí inference bằng cách tăng hiệu quả GPU
      Giờ họ đang tập trung mở rộng catalog mô hình, và Replicate là mảnh ghép hoàn hảo cho bức tranh đó
      Replicate có hạ tầng mô hình lớn và công cụ fine-tuning, nên rất hợp với Worker AI của Cloudflare
      Replicate sẽ được giữ như một thương hiệu độc lập, nên cũng yên tâm phần nào
  • Tôi tò mò liệu Cloudflare có tiếp tục hỗ trợ dự án Cog của Replicate (github.com/replicate/cog) không. Nó từng khá hữu ích cho việc triển khai mô hình cục bộ

    • Khi tự dùng thử, tôi gần như không thấy lợi ích như kỳ vọng, mà ngược lại chỉ còn lại vấn đề về tính tái lập
  • Có vẻ đây là một thương vụ thâu tóm rất khôn ngoan. Tôi đoán Cloudflare Workers và Replicate API sẽ được tích hợp chặt chẽ với nhau

  • Tôi thích cả hai công ty
    Replicate đã giúp việc tạo prototype bằng cách kết hợp nhiều AI trở nên rất dễ dàng, và có vẻ Cloudflare sẽ còn khai phá tốt hơn nữa tiềm năng đó