14 điểm bởi GN⁺ 2023-12-22 | 1 bình luận | Chia sẻ qua WhatsApp

Quyền tiếp cận công bằng với nghiên cứu khoa học

  • arXiv đang nỗ lực để mọi người dùng, bao gồm cả người khuyết tật, có thể tiếp cận nghiên cứu khoa học một cách công bằng.
  • Kể từ ngày 18/12/2023, arXiv đã tạo phiên bản định dạng HTML cho mọi bài báo được gửi bằng TeX/LaTeX (chỉ áp dụng cho các bài được gửi sau ngày 1/12 và chuyển đổi HTML thành công).

Bổ sung định dạng HTML

  • HTML không thay thế PDF mà là một định dạng bổ sung được cung cấp cho người dùng arXiv.
  • Người gửi bài cũng có cơ hội xem trước phiên bản HTML khi nộp bài, tương tự như với PDF.
  • Khi truy cập trang tóm tắt của bài báo, có thể thấy liên kết để xem bài báo HTML ngay bên dưới liên kết PDF.

Cải thiện khả năng tiếp cận cho các nhà khoa học khuyết tật

  • Đã có những yêu cầu cung cấp bài báo ở định dạng HTML vì các nhà khoa học khuyết tật gặp rào cản khi tiếp cận nghiên cứu.
  • Bài báo ở định dạng HTML có thể được các công nghệ như trình đọc màn hình đọc dễ dàng và chính xác hơn, giúp ích cho các nhà nghiên cứu bị khiếm thị, thị lực yếu hoặc mắc chứng khó đọc.

Giai đoạn thử nghiệm của chuyển đổi HTML

  • Hiện tại, việc chuyển đổi sang HTML vẫn đang ở giai đoạn thử nghiệm và arXiv đang tiếp tục cải thiện để chuyển đổi chính xác hơn.
  • Không phải mọi bài báo đều được chuyển đổi chính xác sang HTML, nhưng arXiv muốn cung cấp tính năng này càng sớm càng tốt cho các nhà nghiên cứu cần khả năng tiếp cận.
  • Với các bản gửi mà chuyển đổi HTML thất bại, arXiv sẽ không chặn hoặc giữ lại việc nộp bài, nhưng mong các tác giả xem xét kỹ phiên bản HTML.

Lời cảm ơn đối với dự án HTML

  • arXiv bày tỏ lời cảm ơn đối với HTML thử nghiệm như một bước tiến lớn để làm cho khoa học trở nên dễ tiếp cận với mọi người.
  • arXiv cảm ơn tất cả những người đã hợp tác trong chương trình thí điểm dự án bài báo HTML của arXiv, bao gồm LaTeX Project và nhóm LaTeXML của NIST.
  • Với những người dùng đã quen thuộc với ar5iv, một dự án hợp tác của arXivLabs, việc cung cấp HTML này chính là đưa toàn bộ dự án có ảnh hưởng đó vào nội bộ một cách trọn vẹn.
  • Mục tiêu cuối cùng là backfill toàn bộ kho bài báo của arXiv để cung cấp phiên bản HTML cho mọi bài, nhưng hiện tại tính năng này mới chỉ áp dụng cho các bài báo mới.
  • arXiv cũng cảm ơn tất cả người dùng đã gửi báo cáo lỗi cho dự án bài báo HTML; nhóm hiện đang phân tích các báo cáo lỗi và dự kiến thực hiện đợt cải tiến đầu tiên trong năm mới.

Ý kiến của GN⁺

  • Việc arXiv cung cấp định dạng HTML là một bước tiến quan trọng trong việc cải thiện khả năng tiếp cận nghiên cứu, đặc biệt sẽ rất hữu ích cho các nhà khoa học khuyết tật.
  • Thay đổi này sẽ góp phần giảm các rào cản kỹ thuật trong cộng đồng khoa học và nâng cao tính bao trùm của nghiên cứu.
  • Dù vẫn ở giai đoạn thử nghiệm, quyết định đẩy nhanh việc cung cấp tính năng này của arXiv cho thấy một thái độ tích cực, đặt nhu cầu của các nhà nghiên cứu lên hàng đầu.

1 bình luận

 
GN⁺ 2023-12-22
Ý kiến trên Hacker News
  • Bài viết không liên kết ví dụ HTML, nhưng đây là một liên kết bất kỳ: liên kết ví dụ arXiv HTML. Việc hỗ trợ chế độ tối khá hay. Không thấy nút chuyển, nhưng nó được hiển thị theo chế độ hệ thống. Có vẻ khả năng truy cập arXiv trên di động sẽ được cải thiện đáng kể.
    • Sau 30 năm kể từ khi HTML được phát minh để hỗ trợ khả năng truy cập và cộng tác cho nghiên cứu và học thuật, Nhà Trắng đã công bố hướng dẫn truy cập mới. Đây là lần đầu tiên họ công bố một chính sách chính thức mới bằng HTML thay vì PDF. liên kết hướng dẫn truy cập của Nhà Trắng
    • Nếu muốn cập nhật các bài báo AI/ML quan trọng mới trên arXiv, hãy xem Emergent Mind. Trang này theo dõi các lượt nhắc đến bài báo arXiv trên mạng xã hội (Hacker News, Reddit, X, YouTube, GitHub, v.v.), rồi xếp hạng bài báo dựa trên mức độ hoạt động trên mạng xã hội và thời điểm công bố. Với mỗi bài báo, trang dùng GPT-4 để tóm tắt và cung cấp liên kết đến thảo luận trên mạng xã hội, trích dẫn bài báo và các bài liên quan. Đây vẫn là một trang mới và chưa được chia sẻ nhiều. Rất hoan nghênh phản hồi hoặc yêu cầu để cải thiện.
    • Nếu có bài báo nào trong thanh bên không có liên kết HTML, tôi muốn biết làm sao để xác định lý do nó không được render sang HTML và cách khắc phục.
    • Có lẽ nên cho phép người nộp bài tải lên phiên bản HTML của riêng họ cùng với bản PDF, thay vì chỉ dựa vào quá trình chuyển đổi tự động.
      • Nếu có liên hệ báo rằng phiên bản HTML của bài báo có vấn đề, tác giả có thể sẽ thấy bực bội vì không có cách nào để sửa ngoài việc hy vọng thay đổi trong PDF sẽ ảnh hưởng đến quá trình tạo HTML. Việc sửa trực tiếp lỗi định dạng trong PDF sẽ dễ hơn.
      • Việc cho phép thử nghiệm các định dạng thay thế cho bài báo cũng sẽ rất thú vị. Ví dụ, một bài báo có thể chứa sandbox để thử ngôn ngữ lập trình đang được thảo luận, hoặc trong một bài về giải tích nhiều biến, có thể tương tác với đồ thị 3D của một hàm nào đó.
    • Luôn đặt cược vào web là một quyết định rất đúng đắn.
    • Công cụ được dùng cho dịch vụ này là arXiv-readability. Gắn link ở đây để tiết kiệm vài cú nhấp chuột.
    • PDF vượt trội hơn HTML rất nhiều trong việc render tài liệu văn bản. Và khoảng cách là đáng kể. Điều này đã khả thi từ 10 năm, thậm chí 15-20 năm trước. Việc điều này không diễn ra không chỉ đơn thuần là do quán tính. LaTeX và PDF cho chất lượng dàn chữ tốt hơn hẳn, và định dạng tĩnh cũng hữu ích cho người đến sau vì nó khóa lại trạng thái cố định theo thời gian. Không giống bản chất vốn linh hoạt của HTML. Và nhắc lại, chất lượng render là không thể so sánh, và điều đó truyền tải một tín hiệu chất lượng dù có ý thức hay vô thức.
    • Tôi hy vọng arXiv sẽ không ngừng cung cấp bài báo ở định dạng PDF. Tôi vẫn thích đọc PDF ngay cả trên máy tính.
    • Khi mở các tệp PDF lớn (hơn 100MB, thường gặp trong các bài báo ML tập trung vào tạo ảnh độ phân giải cao) trên arXiv, trong hơn 10 giây chỉ thấy thanh tải mà không có gì được render. Tôi thắc mắc nguyên nhân của độ trễ này là gì. Do mạng, hay Chrome thực sự quá chậm khi render PDF lớn? PDF có cần tải xong hoàn toàn rồi mới bắt đầu render không? Dù sao thì đây là phàn nàn duy nhất của tôi về arXiv, và tài liệu HTML render dần, nơi phần văn bản tải ngay lập tức, sẽ là một cải tiến lớn.