2 điểm bởi GN⁺ 2025-01-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • Trực quan hóa ISBN

    • Anna's Archive cung cấp danh mục sách mở lớn nhất trong lịch sử nhân loại.
    • Mỗi pixel đại diện cho 2.500 ISBN, và pixel sẽ hiển thị màu xanh lá nếu có tệp.
    • Chỉ 16% tổng số sách đã được sao lưu, và vẫn cần thêm nhiều công việc.
  • Bối cảnh

    • Anna's Archive lập danh mục sách bằng cách sử dụng số ISBN để sao lưu tri thức của nhân loại.
    • ISBN được gán cho các cuốn sách được xuất bản ở hầu hết các quốc gia từ thập niên 1970.
    • Hệ thống hoạt động theo mô hình phân tán không có cơ quan trung ương, với số được cấp theo thứ tự quốc gia, nhà xuất bản lớn, rồi nhà xuất bản nhỏ.
    • Anna's Archive thu thập dữ liệu từ nhiều nguồn metadata khác nhau như ISBNdb, Worldcat, Google Books và hơn thế nữa, nhờ đó sở hữu metadata sách mở lớn nhất.
    • Việc xác định và bảo tồn các cuốn sách hiếm và đang bị đe dọa là rất quan trọng.
  • Trực quan hóa

    • Có thể xem riêng từng tập dữ liệu khác nhau, và chuyển đổi bằng menu thả xuống cùng các nút bấm.
    • Các tập dữ liệu bao gồm Anna's Archive, Google Books, Goodreads, Internet Archive và các nguồn khác.
    • Có thể quan sát các mẫu như đường kẻ và khối đều đặn, cũng như các vùng trống trong phần trực quan hóa.
  • Giải thưởng $10,000

    • Có một giải thưởng để cải thiện phần trực quan hóa, và cần nộp mã nguồn mở trước ngày 31 tháng 1 năm 2025.
    • Bài nộp tốt nhất sẽ nhận $6,000, hạng nhì $3,000, hạng ba $1,000, và được chi trả bằng Monero (XMR).
    • Một phần tiền thưởng vẫn có thể được trao ngay cả khi chưa đáp ứng tiêu chí tối thiểu.
    • Bài nộp cần cải thiện phần trực quan hóa bằng cách chỉnh sửa HTML, đồng thời phải hoạt động tốt trên desktop và mobile.
    • Điểm cộng thêm sẽ được chấm dựa trên tính tiện dụng và sức hấp dẫn thị giác.
  • Mã nguồn

    • Mã tạo ảnh và ví dụ nằm trong một thư mục cụ thể.
    • Dữ liệu ISBN được cung cấp dưới dạng định dạng nén 75MB.
    • Không bắt buộc phải dùng định dạng này để tham gia giải thưởng, nhưng đây là định dạng thuận tiện nhất để bắt đầu.
    • Toàn bộ mã phải được cung cấp dưới dạng mã nguồn mở.

1 bình luận

 
GN⁺ 2025-01-11
Ý kiến Hacker News
  • Khi trực quan hóa dữ liệu bằng Hilbert Curve, các điểm gần nhau trong danh sách đã sắp xếp cũng sẽ gần nhau về mặt thị giác. Phần đầu của ISBN gồm quốc gia, phần thứ hai là nhà xuất bản, phần thứ ba là tiêu đề; nếu bỏ checksum và sắp xếp như một số lớn, các quốc gia xuất bản lớn sẽ hiện ra như những "hòn đảo". Sẽ rất hay nếu gắn nhãn cho các vùng này

  • ISBN không có tính phân cấp, và vì được mua theo từng khối nên cách trực quan hóa này không thú vị hoặc hữu ích. Trực quan hóa bằng LoC hoặc Dewey Decimal sẽ hữu ích hơn

  • Anna's Archive là một trong những kỳ quan của thế giới, và ngay cả khi nhân loại gần như bị diệt vong, nếu Anna's Archive vẫn còn thì vẫn sẽ có hy vọng tái thiết nhanh chóng

  • Do bị mù màu nên tôi không phân biệt được các pixel màu đỏ và xanh lá, và ngay cả khi dùng tiện ích mở rộng trình duyệt tôi cũng không thể phân biệt được thêm màu nào. Không rõ có phải biểu đồ này có gì đó bất thường không

  • IP của máy chủ đã bị chặn ở EU. Tôi nhận được thông báo "website này đã bị chặn. lệnh trừng phạt của châu Âu" từ ISP Ziggo ở Hà Lan

  • Không biết có ai khác nhìn thấy thông báo kiểu "Máy chủ này không thể chứng minh rằng nó là annas-archive.org; chứng chỉ bảo mật của nó được cấp cho *.hs.llnwd.net. Điều này có thể do cấu hình sai hoặc do kẻ tấn công đang chặn kết nối của bạn" không

  • Trực quan hóa bằng D3 rất thú vị, có thể ánh xạ nhiều thứ và phóng to

  • Khó biết cái gì tương ứng với cái gì trên biểu đồ. Nếu ai đó chỉ ra Bookland (tức 978) thì sẽ dễ hiểu hơn

  • Tôi thắc mắc việc tải xuống và sử dụng tệp ISBN có bất hợp pháp không. Tôi không hiểu việc sở hữu thông tin đó thì có gì sai

  • Mỗi pixel đại diện cho 2.500 ISBN, và nếu có tệp ISBN thì pixel sẽ xanh hơn. Tôi không hiểu "xanh hơn" nghĩa là gì, và không rõ các pixel màu đen có phải đại diện cho ISBN chưa được đăng ký hay không