- Bluesky dựa trên ATProto hứa hẹn phi tập trung, nhưng trên thực tế phần lớn dữ liệu người dùng lại tập trung trên các máy chủ của Bluesky
- Người dùng có thể tự vận hành máy chủ dữ liệu cá nhân (PDS), nhưng vì sự tiện lợi và tính tương thích, gần như tất cả đều dùng máy chủ mặc định của Bluesky
- Càng có nhiều ứng dụng ATProto mới xuất hiện, dữ liệu càng đổ thêm vào hạ tầng của Bluesky, tạo ra một cấu trúc mà sự tập trung hóa ngày càng được củng cố
- Bluesky trực tiếp kiểm soát các lớp cốt lõi như giao thức, relay, AppView, DID directory, nên khi bị mua lại hoặc thay đổi chính sách, người dùng sẽ khó duy trì quyền kiểm soát
- Về mặt kỹ thuật, có thể rời đi và tự lưu trữ, nhưng trên thực tế thì “mặc định luôn thắng”, và dưới cấu trúc đầu tư hiện tại, áp lực doanh thu càng làm động lực tập trung hóa mạnh hơn
Lời hứa và thực tế của Bluesky
- Bluesky được xây dựng trên giao thức mở ATProto, và tuyên bố rằng người dùng có thể sở hữu dữ liệu và danh tính của mình
- Tangled, Grain, Leaflet và nhiều ứng dụng khác có thể liên kết bằng cùng một tài khoản
- Khả năng “có thể rời đi bất cứ lúc nào nếu muốn” được nêu như một giá trị cốt lõi
- Tuy nhiên, trên thực tế phần lớn dữ liệu lại được lưu trên PDS do Bluesky vận hành
- Tự lưu trữ là khả thi, nhưng việc thiết lập và bảo trì phức tạp, trong khi lợi ích thực tế gần như không đáng kể
- PDS mặc định của Bluesky có thể dùng ngay lập tức và tương thích với mọi ứng dụng, nên người dùng thường ưu tiên lựa chọn này
Cấu trúc tập trung dữ liệu
- Tất cả các ứng dụng ATProto đều ghi dữ liệu vào PDS của người dùng, và đa số người dùng đang sử dụng PDS của Bluesky
- Bài đăng, ảnh, issue và mọi loại dữ liệu khác đều được lưu trên cùng một máy chủ
- Có công cụ di chuyển dữ liệu, nhưng tỷ lệ sử dụng thấp và cần chuẩn bị từ trước
- Nếu sau khi bị mua lại mà việc xuất dữ liệu bị chặn, công cụ chuyển dữ liệu sẽ trở nên vô dụng
- Trong lịch sử, phần lớn người dùng không chủ động bảo vệ dữ liệu của mình từ sớm
Cơ chế làm tăng tốc sự tập trung hóa
- Càng có nhiều ứng dụng ATProto mới xuất hiện thì mức độ phụ thuộc vào hạ tầng Bluesky càng tăng
- Cấu trúc “đăng nhập bằng tài khoản Bluesky” khiến ngày càng nhiều dữ liệu được dồn lên máy chủ Bluesky
- Các nhà phát triển xây dựng tính năng trên hạ tầng Bluesky, và kết quả là càng củng cố vai trò không thể thiếu của Bluesky
- Giao thức này không phân tán giá trị trên toàn mạng lưới, mà có xu hướng dồn giá trị về cho Bluesky
- Bluesky tuyên bố mình “mở và phi tập trung”, nhưng chi phí chuyển đổi thực tế vẫn liên tục tăng lên
Các điểm nghẽn kiểm soát (Chokepoints)
- Relay: lớp cốt lõi mà mọi luồng dữ liệu đều phải đi qua, và Bluesky đang vận hành relay chính
- Bên thứ ba có thể tự vận hành relay, nhưng nếu không có cơ sở người dùng thì điều đó gần như vô nghĩa
- AppView: lớp dùng để dựng timeline, thread và thông báo, hiện phụ thuộc vào AppView chính của Bluesky
- Nếu lớp này bị dừng hoạt động hoặc trở nên đối kháng, mọi client đều sẽ bị ảnh hưởng
- DID Directory: thành phần chịu trách nhiệm phân giải danh tính trong ATProto, hiện do Bluesky quản lý tập trung
- Từ năm 2023 đã có hứa hẹn về phân tán hóa, nhưng chưa có lịch trình cụ thể
- Ở mỗi lớp đều có thể nói rằng “ai cũng có thể tự vận hành”, nhưng trên thực tế gần như không ai làm vậy
So sánh với email
- Email cũng là một giao thức mở, nhưng phần lớn người dùng dùng Gmail, dẫn đến tập trung hóa
- Với ATProto, tình hình thậm chí có thể còn nghiêm trọng hơn
- Với email, mỗi ứng dụng kết nối đến các máy chủ riêng lẻ, còn ATProto thì mọi ứng dụng đều thêm dữ liệu vào cùng một PDS
- Kết quả là “giao thức mở lại trở thành công cụ tăng tốc sự tập trung hóa”
Những vấn đề có thể xảy ra khi bị mua lại
- Nếu Bluesky bị mua lại, bên mua sẽ kiểm soát
- PDS của gần như toàn bộ người dùng
- Relay chính
- AppView chính
- DID Directory dùng để phân giải mọi danh tính
- Bên mua có thể chặn xuất dữ liệu, chặn ứng dụng bên thứ ba, dừng tính năng liên hợp, chèn quảng cáo, kiểm duyệt nội dung
- Phạm vi ảnh hưởng sẽ không chỉ dừng ở mạng xã hội Bluesky mà còn lan ra toàn bộ hệ sinh thái như Tangled, Leaflet, Grain
- Dù trên lý thuyết giao thức cho phép rời đi, công ty mua lại không có động lực để cho phép điều đó
Cấu trúc đầu tư và động lực khuyến khích
- Bluesky là một công ty được định giá 700 triệu USD và nhận 120 triệu USD vốn đầu tư
- Nhà đầu tư đòi hỏi lợi nhuận, và điều này có thể dẫn tới việc siết chặt quyền kiểm soát người dùng hoặc gia tăng áp lực tập trung hóa
- Cấu trúc PBC (công ty vì lợi ích công) được đưa ra như một cơ chế bảo vệ, nhưng hiệu lực pháp lý và tính ràng buộc vẫn chưa rõ ràng
- Kết luận là: “Giao thức không thể cứu bạn khỏi các động lực khuyến khích (The protocol can't save you from incentives)”,
tức động lực kinh tế là yếu tố kiểm soát mạnh hơn so với phi tập trung hóa về mặt kỹ thuật
1 bình luận
Ý kiến trên Hacker News
Ở mọi tầng, đáp án đúng là “ai cũng có thể tự vận hành”, nhưng thực tế gần như không ai làm vậy
Ngoại trừ thư mục PLC, đây là một cấu trúc không ai có thể ngăn cản, nên về lý thuyết ai cũng có thể tham gia
Nhờ sự linh hoạt này, ATproto có điểm xuất phát thuận lợi hơn nhiều so với các hệ thống liên hợp khác
Bluesky cung cấp lối vào cho phi tập trung, nhưng đa số người dùng không chấp nhận chi phí và độ ma sát
Mastodon phi tập trung hoàn toàn nên ngay từ bước đăng ký đã có nhiều ma sát, vì vậy khó phổ biến đại trà
Tôi vẫn hoài nghi, nhưng nếu muốn phổ biến phi tập trung tới đại chúng thì tôi nghĩ mô hình như Bluesky là lựa chọn tốt nhất
Có thể không phải bất khả thi về mặt kỹ thuật, mà là quán tính hoặc thói quen
Nghĩ rằng chỉ cần tồn tại giải pháp là vấn đề sẽ tự động được giải quyết thì quá ngây thơ
Mọi giải pháp đều có sự khác biệt về chi phí và tính khả thi
Muốn tự vận hành PDS thì phải có năng lực kỹ thuật để chạy an toàn và có ngân sách dư dả
Ngay cả người dùng HN cũng khó tự host toàn bộ tài sản số của mình
Rốt cuộc ở đâu đó vẫn sẽ phải dùng dịch vụ miễn phí được vận hành bằng vốn VC
Ai cũng có thể thay đổi, nhưng trên thực tế nhiều khi gần như không thể thay đổi giá trị mặc định
Tôi là người được trích dẫn ở phần mở đầu bài viết
Ý chính là cần cảnh giác với Bluesky
Hạ tầng phải được tự vận hành và cần lập một công ty riêng
Phần lớn phàn nàn là về vấn đề chi phí mở rộng quy mô
Vì việc mang toàn bộ mạng lưới và dữ liệu lịch sử sang nơi khác tốn thời gian và tiền bạc
Phần duy nhất mang tính tập trung về mặt cấu trúc là PLC, và nó đang được tách sang một tổ chức độc lập
Nó từng giải quyết phần lớn vấn đề của Bluesky bằng content addressing và mã hóa khóa ký
Mã SSB gốc đã hỏng sau năm 2020, nhưng tôi có một bản fork đang duy trì
Nếu muốn cùng thử nghiệm, tôi cũng có thể gửi lời mời
Nếu 97% người dùng dồn vào một instance thì khó có thể gọi đó là nền tảng phân tán
Cũng giống như nếu Mastodon.social vượt quá 40% toàn hệ thì ta sẽ xem đó là vấn đề
Khi bàn về kiến trúc của Bluesky thì nhất định phải nhắc tới Blacksky
Nếu không, rất có thể đó là bài viết chưa hiểu đầy đủ về hệ sinh thái giao thức AT
Blacksky là dự án cố gắng tạo ra các triển khai thay thế cho từng tầng của ATproto
Tôi mong điều đó thay đổi, nhưng thực tế ảnh hưởng của nó rất nhỏ
Thà dùng dịch vụ dựa trên XMPP như Movim còn hơn
Có lẽ vì vậy mà bài viết đã bỏ qua nó
Rốt cuộc hệ thống sẽ lấy hành trình người dùng dễ nhất làm tiêu chuẩn
Những giá trị giả định như phòng ngừa rủi ro tương lai không đủ để khiến người dùng hành động
Tôi từng nghe câu “nếu Twitter sụp thì cứ rời đi” từ trước rồi
Nhưng trên thực tế đa số đã không rời đi
Nếu Bluesky là phương án thay thế Twitter thì điều cốt lõi là liệu mọi người thật sự có chuyển đi hay không
UI gần như y hệt, và tiền đề vốn là “nếu Twitter trở nên tệ thì sẽ rời đi”
Những người quanh tôi thực sự đã rời Twitter
Giờ họ giao tiếp bằng cách chia sẻ liên kết Bluesky
Tôi vẫn hoạt động cùng bạn bè trên X và thích trải nghiệm từ thời Twitter
Trên ATproto, bạn luôn có thể xuất dữ liệu (export) bất cứ lúc nào
Vì ứng dụng vốn đã đọc dữ liệu khi tương tác với PDS
Nếu chặn việc đó thì cũng đồng nghĩa chặn chính chức năng của ATproto
Dù Bluesky có cắt giao thức đi nữa thì phần lớn người dùng cũng sẽ không phản đối mạnh
Tham khảo: Thông báo ngừng hỗ trợ Google XMPP
Bluesky được thiết kế để bạn có thể chuyển dữ liệu của mình sang hạ tầng khác bất cứ lúc nào
Trên thực tế các nhóm như Blacksky đang làm đúng như vậy
Việc đa số không di chuyển chỉ là vì họ hài lòng với cách Bluesky đang vận hành hiện nay
Vì thế mới xuất hiện câu hỏi “vấn đề là gì?”
Vấn đề cốt lõi là vì đa số người dùng không thay đổi mặc định, nên cuối cùng mọi thứ vẫn quy về tập trung hóa
Một số người đã tự vận hành và đánh giá tích cực tính mở của Bluesky
Họ nói khó hiểu vì sao lại phải cảnh giác với cấu trúc này
Phi tập trung thực sự rốt cuộc đòi hỏi mọi người đều phải tự vận hành máy chủ của mình
Có gánh nặng về chi phí và bảo trì, nhưng đó là cái giá phải trả
Ít nhất ATproto vẫn đảm bảo tính di chuyển dữ liệu
Điều đó là bất khả thi trên Twitter hay Instagram
Phía AP cũng đang cố đưa vào một phần ưu điểm của ATproto
Bên Nostr có không khí hơi khác, nên tôi không chắc cuộc thảo luận này có đại diện cho toàn bộ cộng đồng đó hay không
Với câu “nếu Twitter sụp thì sẽ rời đi”, tôi thực sự đã rời đi
Giờ tôi cảnh giác với mọi mạng xã hội