6 điểm bởi GN⁺ 2026-01-29 | 1 bình luận | Chia sẻ qua WhatsApp
  • Trong kỷ nguyên AI, khi tiêu chuẩn về chiếm đoạt tài sản trí tuệ trở nên mơ hồ, tranh luận về định nghĩa và phạm vi chấp nhận của đạo văn đang diễn ra quyết liệt hơn
  • Đạo văn đã lặp đi lặp lại trong suốt lịch sử lâu dài của văn học, âm nhạc và diễn thuyết, và thậm chí có cả trường hợp các tác phẩm nổi tiếng dễ dàng lọt qua
  • Do thiếu một định nghĩa rõ ràng, đạo văn được diễn giải rất rộng, từ sao chép nguyên văn đến vay mượn khái niệm, và cùng với tiến bộ công nghệ, phát hiện và sao chép đều trở nên dễ dàng hơn
  • Ranh giới giữa sáng tạo và tính độc đáo đã mơ hồ từ lâu; ngay cả các bậc thầy văn học như Chaucer, Shakespeare và Swift cũng đã từng nhận bị tội đạo văn
  • Anthropic đã thống nhất chi trả 1,5 tỉ USD cho các tác giả vì việc dùng 7 triệu cuốn sách sao chép bất hợp pháp
  • Tính sáng tạo và tính độc đáo luôn tồn tại trong mối căng thẳng với việc mô phỏng, và AI khiến vấn đề lâu đời này lan rộng thành vấn đề của cả cá nhân lẫn xã hội

Sự khoan dung với đạo văn trong các tác phẩm văn học nổi tiếng

Lịch sử của đạo văn và ý nghĩa hiện đại

  • Tác phẩm mới của Roger Kreuz đề cập đến các trường hợp đạo văn đa dạng suốt thế kỷ 20, từ âm nhạc (Bob Dylan) đến văn học (Dylan Thomas) và diễn văn (Joe Biden)
  • Bài nói chuyện nhận giải Nobel văn học của Bob Dylan nhắc đến "Moby Dick" và được phát hiện có diễn đạt tương đồng với SparkNotes
  • Ngay cả chính từ "đạo văn" cũng lấy từ bài thơ của nhà thơ La Mã Martial, với la tinh plagiarius có nghĩa là "kẻ bắt cóc"
  • Theo luật La Mã, kẻ đạo văn bị xem là tội phạm phải bị ném cho thú dữ trong buổi công khai đầu tiên

Tranh luận về đạo văn trỗi dậy trở lại trong thời đại AI

  • Mặc dù khái niệm đạo văn đã rất cũ, nhưng học tập và tạo nội dung bằng AI khiến nó trở nên cấp thiết hơn ở cả phương diện cá nhân và pháp lý
    • Vấn đề đạo đức khi dùng AI để viết sơ yếu lý lịch hoặc thư tình
    • Vấn đề trách nhiệm pháp lý của doanh nghiệp AI trong việc học dữ liệu có bản quyền
  • Ranh giới giữa việc trộm cắp trí tuệ và nguồn cảm hứng trở nên ngày càng mờ nhạt hơn vì AI

Đạo văn khó định nghĩa và tác động của công nghệ

  • Đạo văn trải rộng từ việc sao chép từng chữ đến vay mượn ý tưởng
  • Công nghệ số khiến việc sao chép dễ hơn, nhưng đồng thời việc phát hiện cũng trở nên mạnh hơn
  • Khác với thời chép tay và in chữ rời, chi phí sao chép đã giảm mạnh nên tần suất đạo văn tăng lên

Chương mới của đạo văn trong AI

  • Với việc các mô hình ngôn ngữ lớn (LLM) như ChatGPT và Claude được huấn luyện trên khối lượng lớn tài liệu có bản quyền, có tiếng nói phê phán cho rằng chúng đánh cắp tác phẩm của các nhà sáng tạo
  • Trong một vụ kiện, nguyên đơn cho rằng các doanh nghiệp AI đang thực hiện "đạo văn có tổ chức quy mô lớn"
  • Ngày 15/1/2026, hai nhà xuất bản nộp đơn tham gia vụ kiện tập thể, cáo buộc GoogleAI về "vi phạm bản quyền rộng lớn nhất trong lịch sử"
  • Anthropic đã đạt thỏa thuận bồi thường 1,5 tỉ USD vì đã dùng 7 triệu cuốn sách bị sao chép trái phép để huấn luyện
  • Kreuz lập luận rằng việc dùng ChatGPT không phải đạo văn vì không sao chép nguyên văn từ một nguồn duy nhất
  • Ông ví LLM như một dạng "đạo văn gia" chưa được công nhận, trong khi nhiều người xem đó là "đạo văn có đồng phạm AI"
  • Từ góc nhìn phê phán, đây là một tội phạm kép: AI đánh cắp từ tài liệu đã học, rồi người dùng biến những từ ấy thành lợi ích của chính mình

Ranh giới lâu đời giữa sáng tạo và đạo văn

  • Chaucer, Shakespeare và Swift cũng bị nghi vấn đạo văn, gần như không kém gì một "sách danh vọng của giới văn học"
  • Shakespeare đã mượn cảnh cảnh mạn thuyền trong "Antony and Cleopatra" từ Plutarch trong thời điểm người viết phải sao chép thủ công
  • Để tạo các tác phẩm phỏng theo như "Martin Guzzlewit" và "Oliver Twist" của Dickens, cần có thời gian và công việc sắp chữ
  • Từ khi xuất hiện phím Ctrl+C, đạo văn trở nên dễ dàng hơn và kiểm soát cũng khó khăn hơn
  • 250 năm trước, Laurence Sterne đã mạt sát đạo văn gia bằng hình ảnh các dược sĩ, nhưng sau đó chính cụm từ đó lại được cho là lấy từ Robert Burton
  • Mark Twain từng nói: "Trong phát ngôn của con người, hầu như không có gì ngoài đạo văn"

Phân biệt cảm hứng và đạo văn

  • Câu nói nổi tiếng của T.S. Eliot: "Nhà thơ chưa chín chắn sao chép, nhà thơ chín chắn trộm cắp"
    • Nhưng phần sau ít được biết đến hơn: "Nhà thơ tồi làm biến dạng điều mình lấy, còn nhà thơ hay làm cho nó tốt hơn hoặc thành điều gì khác"
  • Trong vụ kiện Anthropic, thẩm phán so sánh công ty với một "độc giả muốn trở thành tác giả", cho rằng nó tạo ra tác phẩm mới

Sự ra đời của chế độ bản quyền và ảnh hưởng công nghệ

  • Việc thiết lập hệ thống bản quyền vào thế kỷ 18 khiến quyền sao chép được xác định rõ hơn và hành vi vi phạm sao chép có thể bị truy tố rõ ràng hơn
  • Robert Douglas-Fairhurst, giáo sư văn học Anh tại Oxford, cho rằng: "Bản văn là một nghề, nên phải bảo vệ tài sản của mình"
  • Charles Dickens kiện các nhà in đã in lại bản sao, cả vì phẫn nộ bản quyền lẫn lý do kinh tế

Sự tiến bộ của công nghệ phát hiện AI

  • Xu hướng ngày càng nhiều các trường đại học sử dụng AI để phát hiện bài tập do AI viết
  • Sinh viên dùng các dịch vụ như Dumb it Down để biến nội dung do AI tạo thành tự nhiên hơn
  • Chris Caren, CEO của Turnitin - dịch vụ phát hiện đạo văn: bài viết đạo văn thường được viết khá mượt như "màu be" nhưng thiếu tính năng động
  • Đặc điểm ngôn ngữ của văn bản do AI tạo: dùng những từ nhàm chán như "holistic" và từ "notably" quá thường xuyên

Đạo văn trở thành vấn đề của mọi người

  • Tần suất nhắc đến đạo văn trên New York Times tăng 8 lần so với thập niên 1950
  • Dù số lượng vụ việc có thể tăng, các câu chuyện đạo văn vẫn thu hút công chúng vì tuân theo cấu trúc bi kịch hoàn hảo (sự sụp đổ của anh hùng có khiếm khuyết)
  • Trong thời đại AI, tranh luận về đạo văn đã mở rộng từ phạm vi tác giả ra vấn đề của toàn xã hội

Nhìn lại hàm ý kết luận

  • Bài viết toàn bộ châm biếm một thời đại mà đạo văn đã trở thành hành vi phổ biến chứ không còn là ngoại lệ
  • Tiêu đề phụ "steal industry is booming" (ngành công nghiệp trộm cắp đang bùng nổ) thể hiện phê phán khi đạo văn đã trở thành hiện tượng đời sống hằng ngày
  • Nó gợi ý rằng không chỉ văn học, mà trong toàn bộ văn hóa, tính chân thực và độc đáo trong sáng tạo đang bị thách thức
  • Câu hỏi “Chúng ta đã trở thành kẻ đạo văn rồi sao?” nêu lên nhu cầu tái định nghĩa lại đạo đức và giá trị của sáng tạo

1 bình luận

 
GN⁺ 2026-01-29
Ý kiến trên Hacker News
  • Quan điểm của tôi khá đơn giản Việc tái sử dụng nguyên văn một câu dài hoặc từ ngữ mà không nêu nguồn là không nên. Diễn giải lại một câu chuyện đã có theo cách khác là ổn. Nhưng sao chép gần như nguyên vẹn với mục đích đánh lừa ai đó thì không được. Tuy nhiên, mô phỏng phong cách hoặc nội dung theo hướng khác thì có thể chấp nhận. Mọi người quá ám ảnh với tính mới mẻ. Nếu ai đó lấy cảm hứng từ tác phẩm của tôi rồi tái cấu trúc hay diễn đạt lại thì đó là một điều hay. Ví dụ, Star Wars vẫn theo đúng cấu trúc kể chuyện anh hùng kinh điển nhưng vẫn có giá trị. Hầu hết tiểu thuyết giả tưởng hiện đại cũng giống như fanfic của Middle Earth, và chỉ riêng việc tồn tại của chúng đã rất đáng quý. Một người có thể suốt đời bịa ra giai điệu ngẫu nhiên, nhưng không thể đòi sở hữu mọi âm nhạc được tạo ra trong hàng chục năm sau đó.

    • Luật pháp về cơ bản cũng có cùng lập trường. Sử dụng không biến đổi là vấn đề, nhưng sử dụng biến đổi là ổn. Nếu có ý đồ che giấu nguồn thì không, còn bắt chước phong cách là được.
    • Huyền thoại anh hùng không phải là câu chuyện thực mà là một khung tường thuật được phân tích trong cuốn The Hero With a Thousand Faces. Phần lớn tác phẩm hay đều theo cấu trúc này ở mức độ nào đó, nhưng cách triển khai của mỗi người mới làm nên tính đặc biệt. Giống như “ứng dụng web sao chép nguyên bản của React”, thực chất vẫn là hai thứ hoàn toàn khác nhau.
    • Trường học có xu hướng nhấn mạnh thái quá về “tính nguyên bản hoàn toàn”.
    • Như câu nói Everything Is A Remix, sáng tạo hoàn toàn mới gần như là một truyện truyền thuyết. Câu chuyện Newton và quả táo cũng phần nào là huyền thoại được kể lại.
  • Các trường đại học đang tăng cường nỗ lực để phát hiện bài viết do AI viết. Nhưng có một báo cáo nghiên cứu cho thấy độ chính xác AI của Turnitin vào khoảng 90%. Vì vậy không thể xem như phát hiện hoàn hảo.

    • Mình đã thử nhiều công cụ, nhưng vấn đề này thường là về bản chất không thể xử lý được. Có người có thể viết giống AI, và AI có thể viết như con người. Chỉ cần AI giúp viết vài câu, toàn bài vẫn có thể bị gắn nhãn AI. Cuối cùng, ranh giới giữa con người và AI trở nên mờ nhạt.
    • Thật ra, phần lớn bài viết của sinh viên tự thân đã “nhạt nhẽo và thiếu năng động”. Vì thế khó phân biệt với bài viết của AI, và vai trò của kỹ năng viết như một cách chứng minh việc học đang dần biến mất. Có thể việc thuyết trình hay tranh luận bằng lời nói sẽ là bằng chứng học tập duy nhất.
    • Mình đưa bài làm đáng ngờ vào Turnitin và nhiều LLM để so sánh xác suất sinh bởi AI. Nếu xác suất cao, mình xác minh lại trích dẫn và, nếu vẫn đáng ngờ, sẽ mời sinh viên trả lời trực tiếp. Cuối cùng, phán xét của con người vẫn cần thiết.
    • Với độ chính xác 90% thì trên thực tế vẫn là tỷ lệ phát hiện AI 86%, tỷ lệ báo nhầm bài viết người gần như 0%. Kết quả này được điều chỉnh để giảm dương tính giả hơn là âm tính giả. Nếu muốn, có thể cấu hình thành bộ phát hiện cân bằng hơn.
    • Cách nói “90% hiệu quả” là gây hiểu lầm. Thực tế là độ nhạy 90%, độ đặc hiệu 100%. Nghĩa là trong 100 trường hợp gian lận AI, 10 người sẽ không bị phát hiện, nhưng bài viết của con người thì không bị nhận diện sai.
  • Những tác phẩm làm ra bằng công sức bị máy móc tái sử dụng vô hạn và lặp đi lặp lại không có nguồn là điều buồn.

    • Nhưng bản thân tôi cũng đã suốt đời hấp thụ và tái cấu trúc ý tưởng của người khác. Gọi đó là tác phẩm của mình và tự hào về nó là bản chất của con người.
    • Nếu máy móc hấp thụ công việc của tôi rồi truyền đi cho nhiều người những ý tưởng mới, thì bản thân hành động đó có giá trị. Quyền sở hữu trí tuệ (IP) gần như một cơ chế khuyến khích tâm lý hơn là đạo đức. Trong thế giới lý tưởng, nghiên cứu sẽ được thực hiện bằng trí tò mò thuần túy chứ không phải vì lợi ích cá nhân, nhưng thực tế khác.
    • Lao động (work)sản phẩm lao động (work product) là hai khái niệm khác nhau. Nhân viên được trả công cho lao động, còn sản phẩm thuộc về công ty. Còn người tự kinh doanh lại sở hữu sản phẩm nhưng không nhận tiền lương cho lao động. Nếu đã “chia sẻ” theo tinh thần cộng đồng, thì đó là tự phát hành vốn của mình miễn phí. Nếu muốn được đền đáp, cần thương mại hóa hoặc nhận thưởng bằng thương hiệu và danh tiếng.
    • Mình cho rằng quyền sở hữu trí tuệ tự thân vốn là hư cấu. Điều trớ trêu là sau khi AI xuất hiện lại có nhiều người ủng hộ bản quyền hơn.
    • Với tư cách là một nhà toán học, cá nhân tôi không quan tâm quá nhiều đến chuyện này.
  • Nếu làm yếu đi quyền của người sáng tạo thì quyền lực của nhà phân phối (distributor) sẽ tăng. Hầu hết lợi ích kinh tế chảy về phía các nhà phân phối trung gian.

    • Nhưng khi tăng cường bản quyền, nhà phân phối cũng tạo các hợp đồng bắt buộc tác giả phải chuyển quyền cho họ. Chính sách như ở Đức, nơi việc chuyển nhượng bản quyền là không hợp pháp, giúp hạn chế điều đó.
    • Thực ra, dòng chảy này đã tồn tại từ lâu. Giống như ngành dầu mỏ, mô hình tích lũy của cải ở tầng trung gian đã lan rộng trên toàn xã hội. Cơn sốt AI dường như cũng chỉ là phần kéo dài của lòng tham: “làm sao tôi lấy được phần của mình”.
    • Trong thời đại internet, chi phí phân phối gần như bằng không nên bản quyền lại còn củng cố nhà phân phối. Người sáng tạo có năng lực sản xuất hữu hạn, nhưng nhà phân phối có thể tích lũy bản quyền vô hạn.
  • Khái niệm đạo văn trong tiểu thuyết và luận văn học thuật là khác nhau. Tiểu thuyết có thể vay mượn ý tưởng, nhưng trong học thuật, ý tưởng tự thân là tài sản cốt lõi nên việc trích dẫn bắt buộc. Đổi câu chữ chính là một trong những hình thức đạo văn tinh vi nhất. Bài báo tốt sẽ có đầy trích dẫn và tài liệu tham khảo, rồi cộng thêm nhận định mới.

    • “Diễn đạt lại nhưng có trích dẫn” mới là giáo dục đúng đắn. Viết nguyên văn không trích dẫn là đạo văn; diễn đạt lại + trích dẫn là đúng. Dù vậy, ranh giới của ‘kiến thức chung’ (common knowledge) vẫn mơ hồ nên dễ gây rối.
    • Nhưng một số người cho rằng ‘đánh cắp ý tưởng’ tự nó là hư cấu. Bi kịch thật sự của thời đại AI là mọi người đã chấp nhận khái niệm bản quyền mà không phê phán.
  • RiP!: A Remix Manifestovideo YouTube được khuyến nghị. Dù đã ra đời hơn 20 năm, con người vẫn về cơ bản là máy tái phối. LLM là ví dụ đầu tiên mà kỹ thuật hóa được một phần sáng tạo con người. Nó không có cảm xúc, nhưng con người vẫn là bộ lọc cuối cùng để thêm chất lượng và cảm xúc.

  • Kỹ sư khó hiểu quyền sở hữu trí tuệ (IP) vì luật dựa trên ý định (intent). Cấu trúc tòa án dựa vào suy đoán ‘ý định’ để quyết định không khớp với tư duy kỹ sư.

    • Hoặc vì tầng lớp ‘người sáng tạo’ tự mắc kẹt trong cơ chế tự biện minh sự tư nhân hóa ý tưởng khi thu nhập của họ gắn vào đó.
  • “Câu chuyện đạo văn” là bi kịch hấp dẫn như một sử thi anh hùng. Nhưng trước đây ‘các tập đoàn công nghệ’ chỉ là chủ thể truy cập trung gian nội dung. Giờ đây họ trực tiếp sản xuất nội dung bằng AI sinh. Vấn đề trở thành xem họ đã sử dụng trái phép dữ liệu bản quyền quy mô lớn hay chưa, và đó sẽ là việc phải do tòa án phán quyết. Dù vậy, các doanh nghiệp trung gian này vẫn tiếp tục thu thập, giám sát dữ liệu và tự do khai thác thông tin ấy.

  • Ranh giới giữa đạo văn và cảm hứng trong thời đại AI là mờ nhạt. Tranh luận liệu dùng ChatGPT có phải đạo văn hay là hợp tác với một ‘đồng tác giả AI’. Ngay cả giọng đọc AI đọc bài viết cũng là kết quả học từ đặc điểm giọng của con người, thì về bản chất cũng không khác gì vấn đề bản quyền.

  • “Nếu chưa từng có ai viết SF, liệu AI có thể viết được SF không?”

    • Thực ra, SF đã có từ những sử thi đầu tiên của nhân loại. Gilgamesh hay Ramayana đã có yếu tố tưởng tượng từ lâu. Thể loại quá rộng nên không thể sở hữu theo nghĩa tư hữu. Cảm hứng không phải đạo văn.
    • Nếu cho một LLM, vốn chỉ học từ tài liệu cũ, lời giải thích về một phong cách mới rồi bảo viết truyện, chúng ta có thể thử xem nó khác so với phong cách thật như thế nào.
    • Cuối cùng, AI chỉ có thể tạo ra thể loại mới khi có dữ liệu huấn luyện. Không có nền tảng nào, rất khó để tạo SF từ con số 0.
    • AI không viết gì nếu không có prompt đầu vào. Đừng quên điều này.