- Trong kỷ nguyên AI, khi tiêu chuẩn về chiếm đoạt tài sản trí tuệ trở nên mơ hồ, tranh luận về định nghĩa và phạm vi chấp nhận của đạo văn đang diễn ra quyết liệt hơn
- Đạo văn đã lặp đi lặp lại trong suốt lịch sử lâu dài của văn học, âm nhạc và diễn thuyết, và thậm chí có cả trường hợp các tác phẩm nổi tiếng dễ dàng lọt qua
- Do thiếu một định nghĩa rõ ràng, đạo văn được diễn giải rất rộng, từ sao chép nguyên văn đến vay mượn khái niệm, và cùng với tiến bộ công nghệ, phát hiện và sao chép đều trở nên dễ dàng hơn
- Ranh giới giữa sáng tạo và tính độc đáo đã mơ hồ từ lâu; ngay cả các bậc thầy văn học như Chaucer, Shakespeare và Swift cũng đã từng nhận bị tội đạo văn
- Anthropic đã thống nhất chi trả 1,5 tỉ USD cho các tác giả vì việc dùng 7 triệu cuốn sách sao chép bất hợp pháp
- Tính sáng tạo và tính độc đáo luôn tồn tại trong mối căng thẳng với việc mô phỏng, và AI khiến vấn đề lâu đời này lan rộng thành vấn đề của cả cá nhân lẫn xã hội
Sự khoan dung với đạo văn trong các tác phẩm văn học nổi tiếng
Lịch sử của đạo văn và ý nghĩa hiện đại
- Tác phẩm mới của Roger Kreuz đề cập đến các trường hợp đạo văn đa dạng suốt thế kỷ 20, từ âm nhạc (Bob Dylan) đến văn học (Dylan Thomas) và diễn văn (Joe Biden)
- Bài nói chuyện nhận giải Nobel văn học của Bob Dylan nhắc đến "Moby Dick" và được phát hiện có diễn đạt tương đồng với SparkNotes
- Ngay cả chính từ "đạo văn" cũng lấy từ bài thơ của nhà thơ La Mã Martial, với la tinh plagiarius có nghĩa là "kẻ bắt cóc"
- Theo luật La Mã, kẻ đạo văn bị xem là tội phạm phải bị ném cho thú dữ trong buổi công khai đầu tiên
Tranh luận về đạo văn trỗi dậy trở lại trong thời đại AI
- Mặc dù khái niệm đạo văn đã rất cũ, nhưng học tập và tạo nội dung bằng AI khiến nó trở nên cấp thiết hơn ở cả phương diện cá nhân và pháp lý
- Vấn đề đạo đức khi dùng AI để viết sơ yếu lý lịch hoặc thư tình
- Vấn đề trách nhiệm pháp lý của doanh nghiệp AI trong việc học dữ liệu có bản quyền
- Ranh giới giữa việc trộm cắp trí tuệ và nguồn cảm hứng trở nên ngày càng mờ nhạt hơn vì AI
Đạo văn khó định nghĩa và tác động của công nghệ
- Đạo văn trải rộng từ việc sao chép từng chữ đến vay mượn ý tưởng
- Công nghệ số khiến việc sao chép dễ hơn, nhưng đồng thời việc phát hiện cũng trở nên mạnh hơn
- Khác với thời chép tay và in chữ rời, chi phí sao chép đã giảm mạnh nên tần suất đạo văn tăng lên
Chương mới của đạo văn trong AI
- Với việc các mô hình ngôn ngữ lớn (LLM) như ChatGPT và Claude được huấn luyện trên khối lượng lớn tài liệu có bản quyền, có tiếng nói phê phán cho rằng chúng đánh cắp tác phẩm của các nhà sáng tạo
- Trong một vụ kiện, nguyên đơn cho rằng các doanh nghiệp AI đang thực hiện "đạo văn có tổ chức quy mô lớn"
- Ngày 15/1/2026, hai nhà xuất bản nộp đơn tham gia vụ kiện tập thể, cáo buộc GoogleAI về "vi phạm bản quyền rộng lớn nhất trong lịch sử"
- Anthropic đã đạt thỏa thuận bồi thường 1,5 tỉ USD vì đã dùng 7 triệu cuốn sách bị sao chép trái phép để huấn luyện
- Kreuz lập luận rằng việc dùng ChatGPT không phải đạo văn vì không sao chép nguyên văn từ một nguồn duy nhất
- Ông ví LLM như một dạng "đạo văn gia" chưa được công nhận, trong khi nhiều người xem đó là "đạo văn có đồng phạm AI"
- Từ góc nhìn phê phán, đây là một tội phạm kép: AI đánh cắp từ tài liệu đã học, rồi người dùng biến những từ ấy thành lợi ích của chính mình
Ranh giới lâu đời giữa sáng tạo và đạo văn
- Chaucer, Shakespeare và Swift cũng bị nghi vấn đạo văn, gần như không kém gì một "sách danh vọng của giới văn học"
- Shakespeare đã mượn cảnh cảnh mạn thuyền trong "Antony and Cleopatra" từ Plutarch trong thời điểm người viết phải sao chép thủ công
- Để tạo các tác phẩm phỏng theo như "Martin Guzzlewit" và "Oliver Twist" của Dickens, cần có thời gian và công việc sắp chữ
- Từ khi xuất hiện phím Ctrl+C, đạo văn trở nên dễ dàng hơn và kiểm soát cũng khó khăn hơn
- 250 năm trước, Laurence Sterne đã mạt sát đạo văn gia bằng hình ảnh các dược sĩ, nhưng sau đó chính cụm từ đó lại được cho là lấy từ Robert Burton
- Mark Twain từng nói: "Trong phát ngôn của con người, hầu như không có gì ngoài đạo văn"
Phân biệt cảm hứng và đạo văn
- Câu nói nổi tiếng của T.S. Eliot: "Nhà thơ chưa chín chắn sao chép, nhà thơ chín chắn trộm cắp"
- Nhưng phần sau ít được biết đến hơn: "Nhà thơ tồi làm biến dạng điều mình lấy, còn nhà thơ hay làm cho nó tốt hơn hoặc thành điều gì khác"
- Trong vụ kiện Anthropic, thẩm phán so sánh công ty với một "độc giả muốn trở thành tác giả", cho rằng nó tạo ra tác phẩm mới
Sự ra đời của chế độ bản quyền và ảnh hưởng công nghệ
- Việc thiết lập hệ thống bản quyền vào thế kỷ 18 khiến quyền sao chép được xác định rõ hơn và hành vi vi phạm sao chép có thể bị truy tố rõ ràng hơn
- Robert Douglas-Fairhurst, giáo sư văn học Anh tại Oxford, cho rằng: "Bản văn là một nghề, nên phải bảo vệ tài sản của mình"
- Charles Dickens kiện các nhà in đã in lại bản sao, cả vì phẫn nộ bản quyền lẫn lý do kinh tế
Sự tiến bộ của công nghệ phát hiện AI
- Xu hướng ngày càng nhiều các trường đại học sử dụng AI để phát hiện bài tập do AI viết
- Sinh viên dùng các dịch vụ như Dumb it Down để biến nội dung do AI tạo thành tự nhiên hơn
- Chris Caren, CEO của Turnitin - dịch vụ phát hiện đạo văn: bài viết đạo văn thường được viết khá mượt như "màu be" nhưng thiếu tính năng động
- Đặc điểm ngôn ngữ của văn bản do AI tạo: dùng những từ nhàm chán như "holistic" và từ "notably" quá thường xuyên
Đạo văn trở thành vấn đề của mọi người
- Tần suất nhắc đến đạo văn trên New York Times tăng 8 lần so với thập niên 1950
- Dù số lượng vụ việc có thể tăng, các câu chuyện đạo văn vẫn thu hút công chúng vì tuân theo cấu trúc bi kịch hoàn hảo (sự sụp đổ của anh hùng có khiếm khuyết)
- Trong thời đại AI, tranh luận về đạo văn đã mở rộng từ phạm vi tác giả ra vấn đề của toàn xã hội
Nhìn lại hàm ý kết luận
- Bài viết toàn bộ châm biếm một thời đại mà đạo văn đã trở thành hành vi phổ biến chứ không còn là ngoại lệ
- Tiêu đề phụ "steal industry is booming" (ngành công nghiệp trộm cắp đang bùng nổ) thể hiện phê phán khi đạo văn đã trở thành hiện tượng đời sống hằng ngày
- Nó gợi ý rằng không chỉ văn học, mà trong toàn bộ văn hóa, tính chân thực và độc đáo trong sáng tạo đang bị thách thức
- Câu hỏi “Chúng ta đã trở thành kẻ đạo văn rồi sao?” nêu lên nhu cầu tái định nghĩa lại đạo đức và giá trị của sáng tạo
1 bình luận
Ý kiến trên Hacker News
Quan điểm của tôi khá đơn giản Việc tái sử dụng nguyên văn một câu dài hoặc từ ngữ mà không nêu nguồn là không nên. Diễn giải lại một câu chuyện đã có theo cách khác là ổn. Nhưng sao chép gần như nguyên vẹn với mục đích đánh lừa ai đó thì không được. Tuy nhiên, mô phỏng phong cách hoặc nội dung theo hướng khác thì có thể chấp nhận. Mọi người quá ám ảnh với tính mới mẻ. Nếu ai đó lấy cảm hứng từ tác phẩm của tôi rồi tái cấu trúc hay diễn đạt lại thì đó là một điều hay. Ví dụ, Star Wars vẫn theo đúng cấu trúc kể chuyện anh hùng kinh điển nhưng vẫn có giá trị. Hầu hết tiểu thuyết giả tưởng hiện đại cũng giống như fanfic của Middle Earth, và chỉ riêng việc tồn tại của chúng đã rất đáng quý. Một người có thể suốt đời bịa ra giai điệu ngẫu nhiên, nhưng không thể đòi sở hữu mọi âm nhạc được tạo ra trong hàng chục năm sau đó.
Các trường đại học đang tăng cường nỗ lực để phát hiện bài viết do AI viết. Nhưng có một báo cáo nghiên cứu cho thấy độ chính xác AI của Turnitin vào khoảng 90%. Vì vậy không thể xem như phát hiện hoàn hảo.
Những tác phẩm làm ra bằng công sức bị máy móc tái sử dụng vô hạn và lặp đi lặp lại không có nguồn là điều buồn.
Nếu làm yếu đi quyền của người sáng tạo thì quyền lực của nhà phân phối (distributor) sẽ tăng. Hầu hết lợi ích kinh tế chảy về phía các nhà phân phối trung gian.
Khái niệm đạo văn trong tiểu thuyết và luận văn học thuật là khác nhau. Tiểu thuyết có thể vay mượn ý tưởng, nhưng trong học thuật, ý tưởng tự thân là tài sản cốt lõi nên việc trích dẫn bắt buộc. Đổi câu chữ chính là một trong những hình thức đạo văn tinh vi nhất. Bài báo tốt sẽ có đầy trích dẫn và tài liệu tham khảo, rồi cộng thêm nhận định mới.
RiP!: A Remix Manifesto và video YouTube được khuyến nghị. Dù đã ra đời hơn 20 năm, con người vẫn về cơ bản là máy tái phối. LLM là ví dụ đầu tiên mà kỹ thuật hóa được một phần sáng tạo con người. Nó không có cảm xúc, nhưng con người vẫn là bộ lọc cuối cùng để thêm chất lượng và cảm xúc.
Kỹ sư khó hiểu quyền sở hữu trí tuệ (IP) vì luật dựa trên ý định (intent). Cấu trúc tòa án dựa vào suy đoán ‘ý định’ để quyết định không khớp với tư duy kỹ sư.
“Câu chuyện đạo văn” là bi kịch hấp dẫn như một sử thi anh hùng. Nhưng trước đây ‘các tập đoàn công nghệ’ chỉ là chủ thể truy cập trung gian nội dung. Giờ đây họ trực tiếp sản xuất nội dung bằng AI sinh. Vấn đề trở thành xem họ đã sử dụng trái phép dữ liệu bản quyền quy mô lớn hay chưa, và đó sẽ là việc phải do tòa án phán quyết. Dù vậy, các doanh nghiệp trung gian này vẫn tiếp tục thu thập, giám sát dữ liệu và tự do khai thác thông tin ấy.
Ranh giới giữa đạo văn và cảm hứng trong thời đại AI là mờ nhạt. Tranh luận liệu dùng ChatGPT có phải đạo văn hay là hợp tác với một ‘đồng tác giả AI’. Ngay cả giọng đọc AI đọc bài viết cũng là kết quả học từ đặc điểm giọng của con người, thì về bản chất cũng không khác gì vấn đề bản quyền.
“Nếu chưa từng có ai viết SF, liệu AI có thể viết được SF không?”