1 điểm bởi GN⁺ 2024-11-14 | 1 bình luận | Chia sẻ qua WhatsApp

Trực quan hóa 13 triệu người dùng BlueSky

  • So sánh Twitter và BlueSky

    • Twitter là một nền tảng lớn với cơ sở người dùng khổng lồ và nhiều thành phần đa dạng.
    • BlueSky đã tăng trưởng cơ sở người dùng rất nhanh trong vài tháng gần đây, đặc biệt nhờ sự thù địch kéo dài đối với cơ sở người dùng của Twitter và lệnh cấm Twitter tại Brazil.
    • Có thể dùng dữ liệu của BlueSky để trực quan hóa toàn bộ mạng lưới.
  • Thu thập dữ liệu

    • BlueSky dựa trên AT Protocol và được thiết kế để cho phép tự lưu trữ dữ liệu thông qua các máy chủ dữ liệu cá nhân (PDS).
    • Trong dự án này, các sự kiện thời gian thực được thu thập qua WebSocket của bsky.network và lưu vào cơ sở dữ liệu SQLite.
  • Kết xuất đồ thị

    • Việc kết xuất một đồ thị có 13 triệu nút và 500 triệu cạnh là một công việc phức tạp.
    • Đồ thị được trực quan hóa bằng thuật toán force-directed layout, tương tự như một mô phỏng vật lý.
    • Tối ưu hóa Barnes-Hut được dùng để giảm độ phức tạp tính toán.
  • Engine Andromeda

    • Đây là một engine đa luồng được phát triển bằng Zig, dùng GTK4 và OpenGL để tạo GUI.
    • Engine này lấy cảm hứng từ Gephi và bài báo ForceAtlas2, nhấn mạnh tính tương tác cho trực quan hóa đồ thị quy mô lớn.
  • Giảm số chiều bằng UMAP

    • UMAP là một trong những thuật toán cho hiệu năng rất tốt trong trực quan hóa 2 chiều.
    • Dữ liệu được đưa vào UMAP thông qua node embedding để có được hình ảnh trực quan tốt hơn.
    • Ở bước cuối của UMAP, một đồ thị force-directed được dùng để điều chỉnh khoảng cách giữa các nút.
  • Thêm màu sắc

    • Màu sắc được thêm vào bằng cách áp dụng thuật toán phân cụm lên đầu ra của UMAP.
    • k-means clustering được dùng để gán sắc độ cho từng cụm, đồng thời độ sáng của mỗi nút được điều chỉnh theo số lượng follower của nó.
  • Kết quả và kế hoạch tương lai

    • Bản trực quan hóa cho thấy rõ mật độ và cấu trúc của các cụm lớn.
    • Một tính năng trong tương lai là thêm thanh bên để hiển thị timeline của các tài khoản đang xuất hiện trên màn hình.

1 bình luận

 
GN⁺ 2024-11-14
Ý kiến Hacker News
  • Mất hứng thú vì feed BSKY không hoạt động đủ sôi nổi. So với Twitter thời kỳ đầu, họ cho rằng một mạng xã hội mới cần phải năng động hơn
  • Bluesky và atproto được thiết kế để có thể hack được. Cộng đồng đã xây dựng một thư mục có thể tìm kiếm cho các "Starter Packs" của Bluesky
    • Dan Abramov đã khen ngợi dự án này và nhắc rằng việc các công ty mạng xã hội đóng API đã kìm hãm web công cộng
  • Bluesky đang tăng trưởng rất nhanh trong một số lĩnh vực nhất định. Khi các cuộc trò chuyện trên Twitter trở nên không còn giá trị, họ đã chuyển sang Bluesky và hoạt động gần đây đã tăng lên
  • Dự đoán rằng Bluesky sẽ trở thành phiên bản cánh tả của "Truth Social". Họ cho rằng việc chuyển mình thành một thương hiệu toàn cầu sẽ rất khó
  • API của BlueSky được đánh giá là rất tuyệt. Một đồng nghiệp đã tạo bản trực quan hóa dựa trên nó
  • Với tư cách là người dùng đã chuyển sang Bluesky, họ cảm thấy hài lòng. Bluesky giống Twitter năm 2015 nhưng không có quảng cáo hay growth hacking
  • Bản trực quan hóa của Bluesky được đánh giá là truyền tải thông tin hiệu quả và hấp dẫn về mặt thị giác
  • Điểm hay là có thể dùng tên miền làm tên người dùng trên Bluesky. Việc xác minh vì thế trở nên có ý nghĩa hơn
  • BlueSky hiện đang ở trạng thái tích cực và được khuyến nghị nên tạo tài khoản
  • Không thể đưa trực tiếp ma trận của BlueSky vào UMAP, nhưng có thể dùng các kỹ thuật khác để suy ra embedding người dùng