1 điểm bởi GN⁺ 2 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Project Gutenberg cung cấp hơn 75.000 eBook miễn phí, hỗ trợ tải xuống epub·Kindle và đọc trực tuyến
  • Kho sách tập trung vào các tác phẩm văn học lớn của thế giới, đặc biệt chú trọng những tác phẩm cũ đã hết bản quyền tại Mỹ
  • Việc sử dụng hoàn toàn miễn phí, không mất phí·không cần đăng ký·không cần ứng dụng riêng, có thể truy cập bằng trình duyệt web hoặc thiết bị đọc eBook
  • Đây là một dự án đã hoạt động hơn 50 năm, tiên phong về eBook miễn phí từ năm 1971, với hàng trăm tình nguyện viên đóng góp cho việc số hóa và hiệu đính
  • Hỗ trợ tìm kiếm theo tác giả·tiêu đề·chủ đề·ngôn ngữ·định dạng·độ phổ biến, đồng thời có thể tham gia hiệu đính qua Distributed Proofreaders và ghi âm cùng LibriVox

Tìm eBook miễn phí

  • Frequently Downloaded: xem 100 đầu sách được tải xuống nhiều nhất
  • Tìm theo độ phổ biến: cung cấp danh sách sách được sắp xếp theo số lượt tải
  • Main Categories: cung cấp các phân loại chính như ở những nhà sách lớn
  • Reading Lists: cung cấp các danh sách đọc do tình nguyện viên tuyển chọn
  • Search Options: có thể tìm theo tác giả, tiêu đề, chủ đề, ngôn ngữ, định dạng, độ phổ biến, v.v.
  • self.gutenberg.org: cung cấp eBook tự xuất bản của World Library Foundation

Điều kiện sử dụng và tính chất của dự án

  • eBook của Project Gutenberg hoàn toàn miễn phí, không cần trả phí hay đăng ký
  • Không cần ứng dụng riêng, chỉ cần trình duyệt web thông thường hoặc thiết bị đọc eBook là có thể sử dụng
  • Cung cấp các tác phẩm văn học lớn của thế giới, đặc biệt tập trung vào những tác phẩm cũ đã hết bản quyền tại Mỹ
  • Project Gutenberg là một dự án đã hoạt động hơn 50 năm, tiên phong về eBook miễn phí từ năm 1971
  • Hàng trăm tình nguyện viên đã đóng góp qua nhiều năm cho việc số hóa và hiệu đính eBook
  • Dự án cũng nhận quyên góp để số hóa thêm nhiều sách hơn

Cách tham gia

  • Distributed Proofreaders đang tiếp nhận tình nguyện viên mới và là nguồn cung chính cho các eBook mới của Project Gutenberg
  • Chỉ cần hiệu đính một trang mỗi ngày cũng có thể giúp ích cho dự án
  • Qua Fix and improve, bạn có thể báo lỗi, bug, lỗi chính tả và đề xuất thay đổi
  • Có thể tham gia ghi âm audiobook cùng LibriVox

Audiobook

  • Audiobook là một cách khác để thưởng thức văn học, và tất cả các tài nguyên được giới thiệu đều là bản số hóa từ văn bản của Project Gutenberg
  • Các audiobook này đều miễn phí sử dụng và là phạm vi công cộng tại Mỹ
  • Project Gutenberg’s 662 titles read by people: cung cấp 662 đầu sách do người thật đọc
  • Human-read audio books from LibriVox: cung cấp audiobook đọc bởi cộng đồng tình nguyện viên của LibriVox
  • The Project Gutenberg Open Audiobook Collection: bao gồm khoảng 5.000 đầu sách được máy tính tạo giọng, do Project Gutenberg cung cấp vào năm 2023 với sự hợp tác của Microsoft và MIT
  • Project Gutenberg’s audio books from 2003: audiobook tạo bằng máy tính từ năm 2003, vẫn có thể nghe nhưng chất lượng thấp hơn công nghệ ngày nay

1 bình luận

 
Ý kiến trên Hacker News
  • Tôi là một trong các lập trình viên của Gutenberg. Trong vài tháng qua, chúng tôi đã cải thiện trang web rất nhiều và sắp tới vẫn còn thay đổi thêm
    Nếu gần đây bạn chưa vào lại thì rất đáng để xem thử lần nữa: https://www.gutenberg.org/

    • Có lẽ nên cân nhắc có lịch sử phiên bản chi tiết cho từng cuốn sách, tức từng văn bản điện tử. Hiện tại việc gửi sửa lỗi chính tả là qua email (https://www.gutenberg.org/help/errata.html); khi tôi thử vào năm 2011 thì bản sửa được áp dụng trong vài ngày, nhưng quy trình có cảm giác khá thiếu minh bạch
      Lịch sử phiên bản nên bao gồm cả nguồn gốc của văn bản điện tử đó, thường là thông tin dự án như PGDP, để có thể đối chiếu với bản quét trang gốc. Tôi có cảm xúc khá lẫn lộn với Standard Ebooks và vẫn thích dùng trực tiếp Project Gutenberg hơn, nhưng Standard Ebooks có ưu điểm là mỗi cuốn đều có kho git trên GitHub, nên về nguyên tắc có thể xem lịch sử chỉnh sửa theo thời gian
    • Khi nghĩ đến Project Gutenberg, tôi thường nhớ đến kiểu brutalism không thiết kế thô mộc ngày xưa, nhưng trang hiện tại đã được làm mới rất tinh tế, và ngay cả khi tắt style thì khả năng truy cập dường như vẫn rất tốt
    • Điều thú vị là bắt tay TCP mất 4,5 giây, và bắt tay TLS mất thêm 9,2 giây nữa. Hầu hết bot chắc sẽ ngắt trước đó, nên tôi tự hỏi liệu đây có phải một kiểu captcha, tức là nếu hoàn tất được một lần thì sẽ được xem như người dùng hợp lệ hay không
      Ít nhất cho đến khi bot bắt kịp, đây có thể là cách ít gây khó chịu hơn và cũng không phân biệt đối xử với các phần mềm client hiếm không phải Chrome/Chromium. Các yêu cầu còn lại đều rất nhanh
    • Trên di động, phần danh sách sách ở trang đầu được render thành một div có thể cuộn cả ngang lẫn dọc. Có vẻ vẫn còn chỗ để cải thiện
    • Vì có nhiều sách cũ, sẽ rất hay nếu tính năng tìm kiếm có thêm ngày xuất bản hoặc khoảng thời gian. Khi nghiên cứu, tôi khá hay cần tìm tài liệu cũ hơn một năm x nào đó, nên cá nhân thấy điều này sẽ rất hữu ích
  • Tôi mới biết rằng Project Gutenberg có thể đã được sử dụng rộng rãi và phát triển mạnh nhờ sự tăng trưởng và phổ cập của Internet từ thập niên 1990 trở đi, nhưng thực ra nó bắt đầu từ năm 1971
    Dự án khởi đầu khi Michael S. Hart số hóa Tuyên ngôn Độc lập Hoa Kỳ; khi đó Hart là sinh viên Đại học Illinois và có quyền truy cập vào máy tính mainframe Xerox Sigma V của Phòng thí nghiệm Nghiên cứu Vật liệu. Chiếc máy này là một trong 15 nút của ARPANET, tiền thân của Internet sau này, và Hart được cho là đã tin rằng một ngày nào đó công chúng sẽ có thể tiếp cận máy tính, nên quyết định cung cấp miễn phí các tác phẩm văn học dưới dạng điện tử
    https://en.wikipedia.org/wiki/Project_Gutenberg

    • “Project Gutenberg bắt đầu vào năm 1971 khi Michael Hart nhận được một tài khoản operator với 100 triệu USD thời gian máy tính từ những người vận hành mainframe Xerox Sigma V tại Phòng thí nghiệm Nghiên cứu Vật liệu của Đại học Illinois”
      https://www.gutenberg.org/about/background/history_and_philo...
    • Sẽ thật tuyệt nếu các biên tập viên Wikipedia cập nhật bài này
  • Một trong những việc tốt nhất tôi từng làm cho bố là mua cho ông một chiếc Kindle và một access point, rồi chỉ ông cách tải sách từ Project Gutenberg
    Bố tôi là cựu binh hải quân tham chiến ở Triều Tiên và có bằng GED, nhưng rất thích văn chương cổ đến mức đọc hết trọn bộ Harvard Classics. Ông ngồi trên chiếc ghế ưa thích, dùng một chiếc khăn cuộn lại để kê Kindle trên đầu gối, rồi cứ đọc mãi, đọc mãi; đến lúc qua đời, ông đang đọc bản năm 1931 của “Legends of the Jews”
    Vào thập niên 90 tôi từng trao đổi email ngắn với Michael S. Hart và cũng có đóng góp nhỏ cho dự án, điều đó đem lại cho tôi rất nhiều niềm tự hào và vui sướng khi còn là sinh viên cử nhân chuyên ngành văn học Anh. Vì những lý do đó, Project Gutenberg rất đặc biệt đối với tôi, và tôi rất vui khi thấy nó vẫn tiếp tục phát triển tốt

    • Distributed Proofreaders, nơi thực hiện phần chép lại văn bản, vẫn đang tìm tình nguyện viên. Nếu thấy hứng thú thì bạn có thể tham gia
      https://www.pgdp.net
  • Tôi ngạc nhiên là không có hãng máy đọc sách nào tích hợp một “cửa hàng” Project Gutenberg. Chỉ cần có thể duyệt Gutenberg, tìm sách và tải thẳng về máy đọc là được, nhưng thực tế lại có nhiều ma sát như Kindle thì khá tích cực gây khó dễ, hoặc phải dùng Calibre

    • Trên các máy đọc sách có hỗ trợ trình duyệt, tôi vẫn tải và đọc các sách Project Gutenberg được biên tập gọn gàng tại https://standardebooks.org/. Trường hợp của tôi là Boox
      Về mặt kỹ thuật thì cũng có thể tải epub trực tiếp từ Project Gutenberg, nhưng định dạng thường chưa được như mong muốn. Khi đã dùng một máy đọc sách có hệ điều hành tương đối dùng được, ví dụ ngay cả Android gốc đời cũ, thì rất khó quay lại các thiết bị kiểu Kindle
    • Nếu không gỡ giấy phép Project Gutenberg ra khỏi văn bản sách, tức là không chỉ để lại phần nội dung thuộc phạm vi công cộng mà không ai tranh chấp, thì phải trả tiền bản quyền bằng 20% tổng lợi nhuận thu được từ việc sử dụng tác phẩm mang nhãn Project Gutenberg-tm, được tính theo cách kế toán thuế thông thường
      https://www.gutenberg.org/policy/license.html
      Thời iPhone đời đầu, tôi từng bán một ứng dụng đọc sách dựa trên văn bản Project Gutenberg tên là “Eucalyptus”, và đã gửi 20% tổng lợi nhuận cho PG. PG luôn rất ủng hộ ứng dụng đó, và tôi thấy làm vậy là đúng đắn
    • Vì đa số đều vận hành cửa hàng trả phí riêng, họ có động cơ lệch lạc là không muốn cung cấp một mảng có nhiều sách miễn phí
    • Trước đây việc này phần nào làm được với Project Librivox https://librivox.org/ và ứng dụng ebook Gutebooks. Cũng từng có ứng dụng audio, nhưng có vẻ giờ đã bị bỏ, và trên bản cài của tôi nó không còn kết nối được đến máy chủ nữa
      Barnes & Noble đang dùng các công ty dàn trang/nhập liệu sách ở Philippines để khai thác tác phẩm public domain rồi đưa lên cửa hàng của họ, và Amazon dường như cũng có cấu trúc tương tự trong Kindle Store: https://www.amazon.com/Public-Domain-Books-Kindle-Store/s?k=...
      Khá đáng tiếc là PG đã không chủ động đưa sách lên đó để kiếm doanh thu
    • Tôi nghe nói các máy đọc sách Kobo mới có trình duyệt cho phép truy cập gutenberg.org và tải file trực tiếp
      Dù vậy nhìn chung tôi đồng ý. Việc có thể truy cập trực tiếp vào một thư viện 75 nghìn cuốn quả thực rất có giá trị
  • Ở Ý, https://www.gutenberg.org/ trả về 404, còn https://gutenberg.org/ lại mở một trang rất chính thức ghi “police notice. This site is under judicial seizure” và hiển thị số vụ án “criminal proceedings 52127/20 R.N.R.I. tribunal of Rome”
    Tôi không hiểu chuyện gì đang xảy ra. Tôi cứ nghĩ PG xuất bản sách thuộc phạm vi công cộng

    • Tìm thử thì có vẻ đây là một phán quyết từ năm 2020, và PG đã quyết định không kháng cáo
      Toàn bộ câu chuyện bằng tiếng Ý ở https://www.wired.it/internet/web/2020/06/30/progetto-gutenb...
    • Ở Đức cũng từng bị chặn một thời gian theo lệnh của tòa: https://cand.pglaf.org/germany/index.html
    • Tôi đã nhờ Claude tìm hiểu bối cảnh, và nó nói rằng vào tháng 5/2020, tòa án Rome đã ra lệnh cho các ISP ở Ý tịch thu và chặn một danh sách tên miền như một phần của vụ án hình sự nhắm vào các website và kênh Telegram phát tán báo, tạp chí lậu; trong danh sách 28 tên miền đó có cả Project Gutenberg cùng với các trang vi phạm bản quyền thực sự
      Có vẻ tình trạng này đến nay vẫn chưa được giải quyết
  • Thật vui khi thấy công việc chúng tôi làm nhận được nhiều thiện cảm như vậy. Tôi là giám đốc điều hành tương đối mới
    Nếu có biên tập viên Wikipedia nào đang đọc, bài về PG hiện đã khá cũ. Lần cuối tôi xem thì nó vẫn còn ghi là có cung cấp file Plucker, và @Jseiko đã làm một công việc khá ổn

  • Project Gutenberg là một kho báu, nhưng có rất nhiều chi tiết kỹ thuật khiến việc dàn trang tự động cho sách trở nên khó khăn. Standard Ebooks nâng mức độ nhất quán lên đến mức khó tin
    Tôi đã viết một bài so sánh nhiều nguồn sách public domain từ góc độ dàn trang: https://dave.autonoma.ca/blog/2020/04/11/project-gutenberg-p...

  • Project Gutenberg ZIM cũng đáng được nhắc đến. Có thể tải toàn bộ kho ngữ liệu Gutenberg tiếng Anh chỉ khoảng 60GB
    Để tham khảo, toàn bộ Wikipedia tiếng Anh dạng ZIM có kèm hình ảnh vào khoảng 120GB: https://ebookfoundation.org/openzim.html

  • Project Gutenberg từ trước đến nay luôn có thiên hướng văn bản thuần túy, nên tôi lúc nào cũng hơi e dè. Đã hơn 10 năm kể từ lần cuối tôi thực sự dạo kỹ trang này, nên có thể giờ tôi đã sai
    Tôi thích sách có áp dụng kiểu dáng và thích PDF hơn. Ý tưởng của Project Gutenberg rất tuyệt, nhưng các bản quét sách trên archive.org hợp gu tôi hơn. Ví dụ điển hình là “Through the Looking Glass” của Lewis Carroll, với các minh họa tuyệt vời của John Tenniel và cách định dạng văn xuôi đầy sáng tạo rất đặc trưng của Carroll
    Giờ tôi thấy Project Gutenberg cũng có ePub, nếu làm tốt thì có thể rất ổn. Nếu làm không tốt, nó có thể thành một mớ hỗn độn giữa “HTML” reflow và ngắt trang; ai từng in một trang web dài chắc đều biết kết quả sẽ ra sao. Tất nhiên cũng có thể đó là lỗi của trình đọc ePub

    • Chúng tôi hỗ trợ EPUB3 cho hầu hết sách. Đồng thời, mỗi cuốn cũng có bản “Plain Text”, vì theo một nghĩa nào đó đây là định dạng bền vững nhất. PDF cũng đang được thực hiện
    • Như những người khác ở đây cũng đã nói, https://standardebooks.org/ rất tuyệt. Theo tôi hiểu thì họ dùng sách Gutenberg làm nguồn nhưng trau chuốt tốt hơn nhiều
    • Tôi rất thích việc có thể bookmark bản HTML của Project Gutenberg và tiếp tục đọc trên nhiều thiết bị mà không cần đăng nhập
      Tôi tận dụng nhiều tính năng sẵn có của trình duyệt để cải thiện trải nghiệm đọc như phông chữ, nền, chuyển văn bản thành giọng nói, định dạng in, chia sẻ trích đoạn, v.v. Với PDF, epub hay các định dạng khác, trải nghiệm này không tốt bằng. Tôi đã đọc được nhiều văn bản có ý nghĩa trên PG hơn bất kỳ nền tảng số nào khác, và tôi thích việc nó được duy trì gọn gàng, miễn phí
    • Nên thử xem Standard eBooks. Nó lấy văn bản từ Gutenberg và nâng chất lượng độ hoàn thiện ePub lên rõ rệt
    • Ngược lại, tôi lại thích epub hơn cho tiểu thuyết. Chủ yếu tôi đọc trên điện thoại
  • Có vẻ cuốn được tải nhiều nhất hôm qua[0] là Concrete Construction: Methods and Costs của Gillette và Hill[1]. Nó còn vượt cả Moby Dick, Bá tước Monte Cristo, Frankenstein, Romeo and Juliet, v.v.
    Trong 30 ngày gần đây nó được tải 23.644 lần. Tôi tự hỏi có phải hành vi bot không. 23 nghìn lượt có cảm giác là khá nhiều
    [0] https://www.gutenberg.org/browse/scores/top
    [1] https://www.gutenberg.org/ebooks/24855

    • Chắc chắn là do các fan cuồng đang ôn trước khi bộ phim hấp dẫn về bê tông, “The History of Concrete” của John Wilson, ra mắt
    • Tôi cũng thấy nhiều khả năng là lưu lượng bot. Khó mà tin rằng mối quan tâm toàn cầu tới “Concrete Construction Methods” lại đột ngột tăng vọt
    • Điểm Goodreads của nó còn cao hơn Moby Dick. Có vẻ cuốn sách tiếp theo để đọc đã được quyết định rồi