1 điểm bởi GN⁺ 2026-02-22 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bluesky dựa trên ATProto hứa hẹn phi tập trung, nhưng trên thực tế phần lớn dữ liệu người dùng lại tập trung trên các máy chủ của Bluesky
  • Người dùng có thể tự vận hành máy chủ dữ liệu cá nhân (PDS), nhưng vì sự tiện lợi và tính tương thích, gần như tất cả đều dùng máy chủ mặc định của Bluesky
  • Càng có nhiều ứng dụng ATProto mới xuất hiện, dữ liệu càng đổ thêm vào hạ tầng của Bluesky, tạo ra một cấu trúc mà sự tập trung hóa ngày càng được củng cố
  • Bluesky trực tiếp kiểm soát các lớp cốt lõi như giao thức, relay, AppView, DID directory, nên khi bị mua lại hoặc thay đổi chính sách, người dùng sẽ khó duy trì quyền kiểm soát
  • Về mặt kỹ thuật, có thể rời đi và tự lưu trữ, nhưng trên thực tế thì “mặc định luôn thắng”, và dưới cấu trúc đầu tư hiện tại, áp lực doanh thu càng làm động lực tập trung hóa mạnh hơn

Lời hứa và thực tế của Bluesky

  • Bluesky được xây dựng trên giao thức mở ATProto, và tuyên bố rằng người dùng có thể sở hữu dữ liệu và danh tính của mình
    • Tangled, Grain, Leaflet và nhiều ứng dụng khác có thể liên kết bằng cùng một tài khoản
    • Khả năng “có thể rời đi bất cứ lúc nào nếu muốn” được nêu như một giá trị cốt lõi
  • Tuy nhiên, trên thực tế phần lớn dữ liệu lại được lưu trên PDS do Bluesky vận hành
    • Tự lưu trữ là khả thi, nhưng việc thiết lập và bảo trì phức tạp, trong khi lợi ích thực tế gần như không đáng kể
    • PDS mặc định của Bluesky có thể dùng ngay lập tức và tương thích với mọi ứng dụng, nên người dùng thường ưu tiên lựa chọn này

Cấu trúc tập trung dữ liệu

  • Tất cả các ứng dụng ATProto đều ghi dữ liệu vào PDS của người dùng, và đa số người dùng đang sử dụng PDS của Bluesky
    • Bài đăng, ảnh, issue và mọi loại dữ liệu khác đều được lưu trên cùng một máy chủ
  • Có công cụ di chuyển dữ liệu, nhưng tỷ lệ sử dụng thấp và cần chuẩn bị từ trước
    • Nếu sau khi bị mua lại mà việc xuất dữ liệu bị chặn, công cụ chuyển dữ liệu sẽ trở nên vô dụng
    • Trong lịch sử, phần lớn người dùng không chủ động bảo vệ dữ liệu của mình từ sớm

Cơ chế làm tăng tốc sự tập trung hóa

  • Càng có nhiều ứng dụng ATProto mới xuất hiện thì mức độ phụ thuộc vào hạ tầng Bluesky càng tăng
    • Cấu trúc “đăng nhập bằng tài khoản Bluesky” khiến ngày càng nhiều dữ liệu được dồn lên máy chủ Bluesky
    • Các nhà phát triển xây dựng tính năng trên hạ tầng Bluesky, và kết quả là càng củng cố vai trò không thể thiếu của Bluesky
  • Giao thức này không phân tán giá trị trên toàn mạng lưới, mà có xu hướng dồn giá trị về cho Bluesky
  • Bluesky tuyên bố mình “mở và phi tập trung”, nhưng chi phí chuyển đổi thực tế vẫn liên tục tăng lên

Các điểm nghẽn kiểm soát (Chokepoints)

  • Relay: lớp cốt lõi mà mọi luồng dữ liệu đều phải đi qua, và Bluesky đang vận hành relay chính
    • Bên thứ ba có thể tự vận hành relay, nhưng nếu không có cơ sở người dùng thì điều đó gần như vô nghĩa
  • AppView: lớp dùng để dựng timeline, thread và thông báo, hiện phụ thuộc vào AppView chính của Bluesky
    • Nếu lớp này bị dừng hoạt động hoặc trở nên đối kháng, mọi client đều sẽ bị ảnh hưởng
  • DID Directory: thành phần chịu trách nhiệm phân giải danh tính trong ATProto, hiện do Bluesky quản lý tập trung
    • Từ năm 2023 đã có hứa hẹn về phân tán hóa, nhưng chưa có lịch trình cụ thể
  • Ở mỗi lớp đều có thể nói rằng “ai cũng có thể tự vận hành”, nhưng trên thực tế gần như không ai làm vậy

So sánh với email

  • Email cũng là một giao thức mở, nhưng phần lớn người dùng dùng Gmail, dẫn đến tập trung hóa
  • Với ATProto, tình hình thậm chí có thể còn nghiêm trọng hơn
    • Với email, mỗi ứng dụng kết nối đến các máy chủ riêng lẻ, còn ATProto thì mọi ứng dụng đều thêm dữ liệu vào cùng một PDS
    • Kết quả là “giao thức mở lại trở thành công cụ tăng tốc sự tập trung hóa”

Những vấn đề có thể xảy ra khi bị mua lại

  • Nếu Bluesky bị mua lại, bên mua sẽ kiểm soát
    • PDS của gần như toàn bộ người dùng
    • Relay chính
    • AppView chính
    • DID Directory dùng để phân giải mọi danh tính
  • Bên mua có thể chặn xuất dữ liệu, chặn ứng dụng bên thứ ba, dừng tính năng liên hợp, chèn quảng cáo, kiểm duyệt nội dung
  • Phạm vi ảnh hưởng sẽ không chỉ dừng ở mạng xã hội Bluesky mà còn lan ra toàn bộ hệ sinh thái như Tangled, Leaflet, Grain
  • Dù trên lý thuyết giao thức cho phép rời đi, công ty mua lại không có động lực để cho phép điều đó

Cấu trúc đầu tư và động lực khuyến khích

  • Bluesky là một công ty được định giá 700 triệu USD và nhận 120 triệu USD vốn đầu tư
    • Nhà đầu tư đòi hỏi lợi nhuận, và điều này có thể dẫn tới việc siết chặt quyền kiểm soát người dùng hoặc gia tăng áp lực tập trung hóa
  • Cấu trúc PBC (công ty vì lợi ích công) được đưa ra như một cơ chế bảo vệ, nhưng hiệu lực pháp lý và tính ràng buộc vẫn chưa rõ ràng
  • Kết luận là: “Giao thức không thể cứu bạn khỏi các động lực khuyến khích (The protocol can't save you from incentives)”,
    tức động lực kinh tế là yếu tố kiểm soát mạnh hơn so với phi tập trung hóa về mặt kỹ thuật

1 bình luận

 
GN⁺ 2026-02-22
Ý kiến trên Hacker News
  • Ở mọi tầng, đáp án đúng là “ai cũng có thể tự vận hành”, nhưng thực tế gần như không ai làm vậy
    Ngoại trừ thư mục PLC, đây là một cấu trúc không ai có thể ngăn cản, nên về lý thuyết ai cũng có thể tham gia
    Nhờ sự linh hoạt này, ATproto có điểm xuất phát thuận lợi hơn nhiều so với các hệ thống liên hợp khác

    • Nguyên nhân của vấn đề là sự tiện lợi của quy trình đăng ký tập trung được vận hành bằng vốn VC
      Bluesky cung cấp lối vào cho phi tập trung, nhưng đa số người dùng không chấp nhận chi phí và độ ma sát
      Mastodon phi tập trung hoàn toàn nên ngay từ bước đăng ký đã có nhiều ma sát, vì vậy khó phổ biến đại trà
      Tôi vẫn hoài nghi, nhưng nếu muốn phổ biến phi tập trung tới đại chúng thì tôi nghĩ mô hình như Bluesky là lựa chọn tốt nhất
    • Câu “không ai ngăn cản” trên thực tế có nghĩa là có thứ gì đó đang ngăn cản
      Có thể không phải bất khả thi về mặt kỹ thuật, mà là quán tính hoặc thói quen
      Nghĩ rằng chỉ cần tồn tại giải pháp là vấn đề sẽ tự động được giải quyết thì quá ngây thơ
      Mọi giải pháp đều có sự khác biệt về chi phí và tính khả thi
    • Để giải quyết vấn đề thì cần kiến thức và tiền bạc
      Muốn tự vận hành PDS thì phải có năng lực kỹ thuật để chạy an toàn và có ngân sách dư dả
      Ngay cả người dùng HN cũng khó tự host toàn bộ tài sản số của mình
      Rốt cuộc ở đâu đó vẫn sẽ phải dùng dịch vụ miễn phí được vận hành bằng vốn VC
    • Vấn đề thực sự là mặc định (defaults)
      Ai cũng có thể thay đổi, nhưng trên thực tế nhiều khi gần như không thể thay đổi giá trị mặc định
    • Câu hỏi còn lại là: có thể sửa điều này như thế nào?
  • Tôi là người được trích dẫn ở phần mở đầu bài viết
    Ý chính là cần cảnh giác với Bluesky
    Hạ tầng phải được tự vận hành và cần lập một công ty riêng
    Phần lớn phàn nàn là về vấn đề chi phí mở rộng quy mô
    Vì việc mang toàn bộ mạng lưới và dữ liệu lịch sử sang nơi khác tốn thời gian và tiền bạc
    Phần duy nhất mang tính tập trung về mặt cấu trúc là PLC, và nó đang được tách sang một tổ chức độc lập

    • Nếu thấy Bluesky đáng lo, tôi khuyên nên xem dự án cũ Secure-Scuttlebot(SSB)
      Nó từng giải quyết phần lớn vấn đề của Bluesky bằng content addressing và mã hóa khóa ký
      Mã SSB gốc đã hỏng sau năm 2020, nhưng tôi có một bản fork đang duy trì
      Nếu muốn cùng thử nghiệm, tôi cũng có thể gửi lời mời
    • Vì việc tự vận hành một instance Bluesky vẫn còn khó, nên kết cục vẫn là tập trung hóa
      Nếu 97% người dùng dồn vào một instance thì khó có thể gọi đó là nền tảng phân tán
      Cũng giống như nếu Mastodon.social vượt quá 40% toàn hệ thì ta sẽ xem đó là vấn đề
    • Chuyển PLC sang một tổ chức độc lập không có nghĩa là phi tập trung sẽ được hiện thực hóa
  • Khi bàn về kiến trúc của Bluesky thì nhất định phải nhắc tới Blacksky
    Nếu không, rất có thể đó là bài viết chưa hiểu đầy đủ về hệ sinh thái giao thức AT
    Blacksky là dự án cố gắng tạo ra các triển khai thay thế cho từng tầng của ATproto

    • Tôi biết rõ Blacksky, nhưng ở bức tranh lớn thì không có gì thay đổi
      Tôi mong điều đó thay đổi, nhưng thực tế ảnh hưởng của nó rất nhỏ
    • Tự xưng là phi tập trung, nhưng rốt cuộc vẫn là vận hành lại một dịch vụ tập trung
      Thà dùng dịch vụ dựa trên XMPP như Movim còn hơn
    • Thực tế nó chỉ là một kho lưu trữ có 1 người đóng góp đang hoạt động
      Có lẽ vì vậy mà bài viết đã bỏ qua nó
    • Nếu phải đổi mặc định thì 99% người dùng sẽ không thử
      Rốt cuộc hệ thống sẽ lấy hành trình người dùng dễ nhất làm tiêu chuẩn
      Những giá trị giả định như phòng ngừa rủi ro tương lai không đủ để khiến người dùng hành động
  • Tôi từng nghe câu “nếu Twitter sụp thì cứ rời đi” từ trước rồi
    Nhưng trên thực tế đa số đã không rời đi
    Nếu Bluesky là phương án thay thế Twitter thì điều cốt lõi là liệu mọi người thật sự có chuyển đi hay không
    UI gần như y hệt, và tiền đề vốn là “nếu Twitter trở nên tệ thì sẽ rời đi”

    • Câu này có vẻ mang nghĩa rằng mọi người chuyển từ X sang Bluesky vì phi tập trung, nhưng cuối cùng lại gặp phải lock-in tương tự
  • Những người quanh tôi thực sự đã rời Twitter
    Giờ họ giao tiếp bằng cách chia sẻ liên kết Bluesky

    • Tôi chẳng quen ai trên Bluesky
      Tôi vẫn hoạt động cùng bạn bè trên X và thích trải nghiệm từ thời Twitter
  • Trên ATproto, bạn luôn có thể xuất dữ liệu (export) bất cứ lúc nào
    Vì ứng dụng vốn đã đọc dữ liệu khi tương tác với PDS
    Nếu chặn việc đó thì cũng đồng nghĩa chặn chính chức năng của ATproto

    • Nhưng Twitter cũng đã xóa API, còn Google cũng đã ngừng liên hợp XMPP
      Dù Bluesky có cắt giao thức đi nữa thì phần lớn người dùng cũng sẽ không phản đối mạnh
      Tham khảo: Thông báo ngừng hỗ trợ Google XMPP
    • Nếu dùng dịch vụ sao lưu thì có thể tránh bị chặn truy cập dữ liệu
  • Bluesky được thiết kế để bạn có thể chuyển dữ liệu của mình sang hạ tầng khác bất cứ lúc nào
    Trên thực tế các nhóm như Blacksky đang làm đúng như vậy
    Việc đa số không di chuyển chỉ là vì họ hài lòng với cách Bluesky đang vận hành hiện nay
    Vì thế mới xuất hiện câu hỏi “vấn đề là gì?”

    • Nhưng thời Twitter thì đa số cũng đã hài lòng
    • Câu hỏi “vấn đề là gì?” đã bỏ lỡ trọng tâm
      Vấn đề cốt lõi là vì đa số người dùng không thay đổi mặc định, nên cuối cùng mọi thứ vẫn quy về tập trung hóa
  • Một số người đã tự vận hành và đánh giá tích cực tính mở của Bluesky
    Họ nói khó hiểu vì sao lại phải cảnh giác với cấu trúc này

    • Nhưng ý chính của bài là lời cảnh báo rằng “khi vấn đề xảy ra thì đã quá muộn
  • Phi tập trung thực sự rốt cuộc đòi hỏi mọi người đều phải tự vận hành máy chủ của mình
    Có gánh nặng về chi phí và bảo trì, nhưng đó là cái giá phải trả
    Ít nhất ATproto vẫn đảm bảo tính di chuyển dữ liệu
    Điều đó là bất khả thi trên Twitter hay Instagram

    • Tính di chuyển (portability) này là nỗ lực nhằm bù đắp giới hạn của ActivityPub
      Phía AP cũng đang cố đưa vào một phần ưu điểm của ATproto
      Bên Nostr có không khí hơi khác, nên tôi không chắc cuộc thảo luận này có đại diện cho toàn bộ cộng đồng đó hay không
  • Với câu “nếu Twitter sụp thì sẽ rời đi”, tôi thực sự đã rời đi
    Giờ tôi cảnh giác với mọi mạng xã hội

    • Kết quả là tôi đã mất dữ liệu và các kết nối xã hội, và trải nghiệm đó khiến tôi trở nên thận trọng