5 điểm bởi GN⁺ 2026-03-21 | 1 bình luận | Chia sẻ qua WhatsApp
  • ArXiv.org, máy chủ preprint tiên phong được thành lập năm 1991, sẽ chuyển thành tổ chức phi lợi nhuận độc lập với Cornell University từ ngày 1 tháng 7
  • Thông qua việc độc lập, nền tảng này sẽ thúc đẩy mở rộng cơ sở nhà tài trợ và tăng cường nhân sự kỹ thuật để ứng phó với lượng bài nộp tăng vọt lên tới 300.000 bài mỗi năm và vấn đề các bài báo kém chất lượng do AI tạo ra (AI slop)
  • Trong 2 năm gần đây, thâm hụt vận hành và lượng bài gửi tăng 50% đã làm áp lực tài chính gia tăng; Cornell trong năm 2025 đã bù khoản thâm hụt 297.000 USDhỗ trợ hiện vật trị giá 819.000 USD
  • Nhà sáng lập Paul Ginsparg chỉ ra rằng các trường đại học khó có thể duy trì hạ tầng nghiên cứu toàn cầu trong dài hạn, và cho rằng độc lập là điều thiết yếu để đảm bảo tính bền vững
  • Động thái này tương tự trường hợp bioRxiv và medRxiv tách độc lập, và ArXiv bắt đầu trong trạng thái ổn định tài chính ban đầu, đã có nguồn kinh phí vận hành cho vài năm tới

Quyết định độc lập của ArXiv

  • ArXiv.org khởi đầu năm 1991 như một nền tảng đăng preprint khoa học nhanh chóng và miễn phí, và đã được Cornell University lưu trữ trong hơn 20 năm
  • Từ ngày 1 tháng 7, nền tảng này sẽ chuyển thành tổ chức phi lợi nhuận độc lập, và hiện đang tuyển giám đốc điều hành (CEO) cho tổ chức mới
  • Phó hiệu trưởng Cornell Tech, Greg Morrisett, giải thích rằng việc độc lập sẽ giúp thu hút thêm các nhà tài trợ đa dạng hơn và mở rộng hạ tầng kỹ thuật
    • Năm nay dự kiến sẽ có hơn 300.000 preprint được đăng
    • Cũng cần kinh phí để xử lý vấn đề các bài báo kém chất lượng do AI viết ra (AI slop)

Cấu trúc tài chính và áp lực tăng trưởng

  • Từ sau năm 2022, số bài nộp đã tăng 50%, và đội ngũ nhân sự được mở rộng lên 27 người
  • Năm 2025 phát sinh khoản thâm hụt 297.000 USD, và Cornell đã bù đắp khoản này
    • Cornell cũng hỗ trợ hiện vật trị giá 819.000 USD
    • Chi phí vận hành hằng năm của ArXiv vào khoảng 6,7 triệu USD
  • Hơn 270 tổ chức đang hỗ trợ ArXiv bằng cách đóng phí thường niên
    • Một số tổ chức đóng tối đa 10.000 USD mỗi năm
    • Các tổ chức thành viên có quyền tham gia vận hành và quyền truy cập dữ liệu sử dụng
  • Các nhà tài trợ lớn gồm Simons FoundationSchmidt Sciences; gần đây hai tổ chức này đã hỗ trợ kinh phí nâng cấp công nghệ

Bối cảnh thúc đẩy việc độc lập

  • Ngay trong nội bộ Cornell Tech cũng tồn tại cạnh tranh về nguồn vốn, và một số bên lo ngại ảnh hưởng của Cornell là quá lớn
  • Morrisett, ban lãnh đạo ArXiv và các nhà tài trợ cho rằng độc lập là cách tốt nhất để đa dạng hóa và mở rộng nguồn vốn
  • Nhà sáng lập Paul Ginsparg cũng khuyến nghị nên độc lập
    • Ông chỉ ra rằng các trường đại học thiếu kinh nghiệm trong việc cung cấp hạ tầng nghiên cứu toàn cầu dài hạn
    • Cornell bị hạn chế trong khả năng tuyển dụng kỹ sư phần mềm, và trang web vẫn giữ hình thức đơn giản
  • Cornell và Simons đã chuẩn bị nguồn quỹ ổn định tài chính ban đầu để ArXiv có thể khởi đầu mà không bị thâm hụt
    • Trong ngắn hạn không có kế hoạch tăng phí thành viên

Phản ứng và lo ngại trong giới học thuật

  • Một số nhà khoa học bày tỏ lo ngại về khả năng thương mại hóa và mức lương khoảng 300.000 USD của CEO mới
    • Phía ArXiv không đồng ý với các lo ngại này
  • Ginsparg cho biết ông hiểu những lo ngại đó, nhưng nhấn mạnh rằng hoạt động của ArXiv luôn dựa trên nền tảng tài chính bấp bênh
    • Ông ví điều này với bộ phim năm 1914 Perils of Pauline, nói rằng nó “luôn ở trong trạng thái chênh vênh”

Vai trò của nhà sáng lập Ginsparg và kế hoạch sắp tới

  • Ginsparg hiện vẫn là giáo sư tại Cornell và tiếp tục tham gia vận hành ArXiv
  • Ông đã dẫn dắt ArXiv suốt 35 năm, và đang dần giảm vai trò cũng như cân nhắc nghỉ hưu
  • Sau khi tổ chức phi lợi nhuận mới đi vào hoạt động, ông vẫn sẽ hỗ trợ giai đoạn ổn định ban đầu, nhưng về dài hạn dự định sẽ bàn giao cho người kế nhiệm

So sánh với các máy chủ preprint khác

  • Việc ArXiv độc lập tương tự trường hợp bioRxiv và medRxiv tách khỏi Cold Spring Harbor Laboratory để chuyển sang openRxiv
  • Cả ba nền tảng đều hướng tới đảm bảo tính bền vững thông qua mô hình độc lập phi lợi nhuận

1 bình luận

 
GN⁺ 2026-03-21
Ý kiến trên Hacker News
  • Việc arXiv gần đây tuyên bố sẽ từ chối các bài tổng quan và position paper khiến tôi có cảm giác đây là dấu hiệu cho thấy nền tảng đang ngày càng thiên về ‘ý kiến’ hơn
    Ban đầu, arXiv chỉ là một dịch vụ lưu trữ PDF, đóng vai trò cung cấp mức độ tin cậy tối thiểu để các bài báo có thể được trích dẫn trước khi xuất bản chính thức
    Nhưng theo thời gian, đặc biệt trong lĩnh vực ML, bản thân arXiv đã trở thành một địa điểm công bố chính thức (venue) Giờ đây, tôi nghĩ rằng arXiv càng có nhiều quyền lực thì càng rời xa chức năng ban đầu của nó. Khó mà tin rằng việc tách khỏi Cornell thực sự là để cải thiện chức năng
    Những gì được nói trong tuyên bố chính thức và FAQ(liên kết) nghe như kiểu ‘lời lẽ trấn an’ điển hình
    Câu trả lời cho câu hỏi “Người dùng có thể kỳ vọng những thay đổi tích cực nào?” có lẽ chỉ là họ sẽ trực tiếp thấy những thay đổi tiêu cực

    • Trong vật lý, đặc biệt là lý thuyết, việc đăng bản nháp lên arXiv rồi nhận phản hồi để chỉnh sửa là thông lệ lâu đời. Đây không chỉ là vấn đề riêng của ML
    • Tôi cũng nghĩ tương tự. Từ góc nhìn của người dùng ML nhưng không chuyên ngành này, có sự xung đột giữa những người tin rằng chỉ arXiv là đủ và những người vẫn tin rằng chỉ xuất bản trên tạp chí chính thức mới là nghiên cứu thật sự
      Tôi hiểu tốc độ rất nhanh của phía ML, nhưng giá trị mà quá trình peer review mang lại cũng rất lớn. Thay vì vứt bỏ hoàn toàn, nên đi theo hướng cải cách
      Sẽ rất tốt nếu một nền tảng như arXiv có thể dẫn dắt cải cách cho toàn bộ giới học thuật
    • Câu “arXiv càng ít quyền lực thì càng thực hiện tốt chức năng của mình” làm tôi nghĩ đến ‘nguyên tắc quyền lực tối thiểu (rule of least power)’ (liên kết wiki)
    • Từ góc nhìn của người đã trực tiếp trải qua quy trình xuất bản, xuất bản trên tạp chí truyền thống ngày càng gây mệt mỏi với phí đăng cao, UI bất tiện và các bài review vô nghĩa. Vì vậy, tôi thấy đăng lên arXiv rồi kết thúc ở đó còn tốt hơn
    • Dạo này trên arXiv còn có cả các bài báo lừa đảo trong lĩnh vực sức khỏe và thực phẩm bổ sung. Cũng có trường hợp đăng bài báo giả tạo bằng ChatGPT rồi quảng bá như ‘nghiên cứu đã xuất bản’
      Các nhà nghiên cứu thì không bị lừa, nhưng công chúng rất dễ tin. Gần đây những tài liệu như vậy quá nhiều, nên tôi nghi ngờ liệu hệ thống kiểm duyệt của arXiv có đang hoạt động đúng hay không
  • Có ý kiến cho rằng mức lương 300.000 USD của CEO mới của arXiv là cao, nhưng tôi nghĩ ngay cả với tổ chức phi lợi nhuận thì để tuyển được người đủ năng lực cạnh tranh cũng cần mức đó

    • Ở ngoài nước Mỹ, 300.000 USD trông như một con số vô lý. Hệ thống lương ở Mỹ cao một cách bất thường
    • Xét đến tầm ảnh hưởng toàn cầu của arXiv thì mức đó thậm chí còn thấp. Tuy vậy cũng cần xem cả mặt bằng lương của các nhân viên khác
    • Ở ngoài Thung lũng Silicon thì đây chắc chắn là số tiền lớn. arXiv không phải tổ chức nhằm tối đa hóa giá trị cổ đông, nên thù lao quá mức là không cần thiết
    • Việc tổ chức phi lợi nhuận tạo ra những ‘ghế ngồi êm ái’ lãng phí tiền quyên góp là một vấn đề. Suy cho cùng arXiv cũng chỉ là một thư mục trên đám mây, nên khó chấp nhận mức lương cao như vậy
    • CEO cũng không nhất thiết phải là một người tầm giáo sư danh dự/sắp nghỉ hưu. Đây chỉ là một kho lưu trữ preprint đơn giản
  • Có thể xem tuyên bố chính thức của arXiv tại đây

    • Liên kết này mới là trọng tâm hơn bài báo gốc. Nội dung bài báo được viết dựa trên tin tuyển dụng CEO
  • Tôi nghĩ việc giải quyết vấn đề lập chỉ mục (xếp hạng) quan trọng hơn là lọc nội dung của arXiv
    Giống như khi web hỗn loạn và Google sắp xếp nó bằng PageRank, tôi tự hỏi liệu có thể tạo ra một hệ thống xếp hạng học thuật dựa trên quan hệ trích dẫn giữa các bài báo hay không

    • Tôi cũng nghĩ vậy. Nếu arXiv biến thành một tạp chí chặn bài như các journal thì lý do tồn tại của nó sẽ biến mất. Tuy nhiên, trong bối cảnh hiện nay khi các bài báo spam do LLM tạo ra đang tràn ngập, vẫn cần mức lọc tối thiểu
      Mức đó nên chỉ để ngăn lạm dụng chứ không phải chặn hoàn toàn. Ngoài ra, hệ thống xếp hạng và gắn thẻ do người dùng dẫn dắt sẽ đáng mong muốn hơn
    • Bản thân PageRank vốn ban đầu đã lấy cảm hứng từ bibliometrics, nhưng các hệ thống xếp hạng học thuật hiện nay đã bị méo mó sẵn rồi. Chỉ chỉnh phần xếp hạng thôi thì không giải quyết được vấn đề
    • Một trang tham khảo liên quan được đề xuất là readabstracted.com
  • Về mặt kỹ thuật, mirror arXiv không khó. Vấn đề là chuyển người dùng sang đó
    Giới học thuật rất bảo thủ trong việc tiếp nhận hệ thống mới, nhưng nếu arXiv thực sự trở nên không thể dùng được thì cuối cùng họ cũng sẽ phải chuyển sang nền tảng thay thế
    arXiv hiện vẫn chỉ là một kho PDF đơn giản, nhưng nó có tiềm năng đổi mới cách chia sẻ nghiên cứu rất lớn
    Việc thoát khỏi ảnh hưởng của trường đại học thậm chí có thể là điều tốt. Tuy nhiên, thành công hay không phụ thuộc vào năng lực của ban điều hành

  • Thành thật mà nói, tôi không hiểu vì sao arXiv lại tách khỏi Cornell. Tôi không thấy ‘vấn đề’ nào cần giải quyết cả

    • Lý do được nêu khá rõ trong bài báo
    • Tôi nghĩ vấn đề được nhắc ở đoạn thứ 6 thực sự cần được giải quyết
  • Tôi từng nghĩ liệu một cơ quan như National Science Foundation (NSF) có thể vận hành một trang như arXiv hay không
    Có vẻ có thể thiết kế theo hướng bất kỳ nhà nghiên cứu đã được xác thực nào cũng có thể tải lên, và nếu hoạt động với vai trò reviewer thì sẽ nhận được điểm tin cậy

    • Nhìn vào các đợt cắt giảm tài trợ khoa học trong vài năm gần đây, có lẽ lại là điều may mắn khi chính phủ không trực tiếp vận hành hạ tầng cốt lõi như arXiv
    • Cũng có thể dùng mô hình chính phủ ủy thác, như trường hợp NIST vận hành kho CVE thông qua MITRE
  • Hệ thống endorsement của arXiv là một rào cản lớn với các nhà nghiên cứu độc lập
    Nếu không có email tổ chức hoặc liên hệ với tác giả sẵn có thì không thể tải bài lên một số lĩnh vực nhất định (cs.NE)
    Nếu muốn tăng tính độc lập, hy vọng họ cũng sẽ cải thiện khả năng tiếp cận cho các nhà nghiên cứu không trực thuộc tổ chức

  • Nghĩ đến việc Cornell thu 50.000 USD học phí mỗi năm, thì lương CEO 300.000 USD cũng không phải là con số quá lớn

    • Nếu tính theo mặt bằng New York City thì giá trị thực tế của 300.000 USD không cao
    • Nhìn vào mức học phí đại học hiện nay là thấy con số đó phi thực tế đến mức nào
  • Video liên quan: liên kết YouTube