- Viết bằng LLM đã lan sang blog, mạng xã hội, báo chí, sách, kiểm tra chính tả và soạn bản nháp, và lối văn lặp đi lặp lại khiến bài viết trông như một thứ slop đồng nhất
- Độc giả kỳ vọng rằng, tương xứng với thời gian họ bỏ ra để đọc, tác giả cũng đã bỏ ra lao động trí tuệ; việc dùng LLM làm lung lay kỳ vọng này, bất kể chất lượng đầu ra ra sao
- Oxide RFD 576 cho rằng niềm tin rằng tác giả đã tự mình hiểu và viết ra là điều chính đáng hóa nỗ lực thấu hiểu của độc giả, và văn xuôi do LLM tạo ra làm tổn hại khế ước xã hội này
- Sau ChatGPT, văn bản sinh ra không chỉ được dùng để viết trực tiếp mà còn ảnh hưởng đến lời nói và văn phong của con người, thể hiện qua việc các từ như “delve”, “realm”, “meticulous” được dùng nhiều hơn
- Tiêu chuẩn của một bài viết hay đang dịch chuyển từ độ hoàn thiện về ngữ pháp và từ vựng sang cách diễn đạt độc đáo và dấu vết con người; cả lỗi chính tả cũng có thể trở thành tín hiệu phân biệt với văn bản AI
Viết bằng LLM và khế ước xã hội
- LLM đã lan rộng sang nhiều ngành, nhưng đặc biệt là trong viết lách: chúng được dùng rộng rãi cho blog, mạng xã hội, báo chí, sách, kiểm tra chính tả, ngữ pháp, kiểm chứng sự thật và soạn toàn bộ bản nháp
- Chúng rất mạnh trong việc tạo ra lượng lớn nội dung, nhưng một khi bắt đầu nhận ra các thành ngữ và mẫu văn phong đặc trưng của LLM, ta sẽ thấy cùng một cảm giác đó lặp lại ở khắp nơi
- Những cách diễn đạt như “it’s not x, it’s why”, dấu gạch ngang dài, hay “you’re not imagining it, the problem is real” cứ lặp đi lặp lại, khiến văn bản ngày càng bị đồng nhất thành cùng một loại slop
- Độc giả cảm thấy phản cảm mạnh vào khoảnh khắc nhận ra mình đã bỏ thời gian để đọc trong khi tác giả lại không bỏ ra lượng thời gian tương xứng
- Sự phản cảm đó không biến mất ngay cả khi nội dung chính xác, được nghiên cứu đầy đủ và bản thân bài viết vẫn ổn
Vấn đề mà Oxide RFD 576 nêu ra
- Mục 2.4 “LLMs as writers” của Oxide RFD 576 cho rằng văn xuôi do LLM tạo ra làm tổn hại khế ước xã hội của việc viết
- Khi chưa có LLM, tồn tại tiền đề rằng trong hai bên độc giả và tác giả thì tác giả đã bỏ ra nhiều lao động trí tuệ hơn
- Khi độc giả có thể tin rằng tác giả đã tự mình hiểu điều gì đó rồi mới viết ra, họ có lý do để nỗ lực thấu hiểu những câu văn và ý tưởng khó
- Khi viết bằng LLM, tách biệt khỏi chất lượng bài viết hay độ chính xác của nội dung, lượng công sức mà tác giả bỏ ra để tạo nên nội dung sẽ giảm đi
- Vấn đề cốt lõi không chỉ nằm ở chất lượng đầu ra, mà ở chính hành vi dùng LLM thay vì tự viết, tức là đã phá vỡ khế ước xã hội đó
Ảnh hưởng khó tránh của văn bản sinh ra
- Ngay cả khi không trực tiếp dùng LLM, làn sóng văn bản sinh ra vẫn ảnh hưởng đến lời nói và chữ viết của con người
- Những cách nói như “you’re absolutely right” thường được dùng để châm chọc LLM, nhưng bản thân công cụ này cũng đang âm thầm thay đổi thói quen ngôn ngữ của con người
- Nghiên cứu của Max-Planck Institute for Human Development phân tích rằng các từ được ChatGPT ưa chuộng đã bắt đầu xuất hiện thường xuyên hơn cả trong khẩu ngữ của con người
- Những từ tăng lên gồm delve, realm, meticulous, adept, boast, swift, comprehend
- Đầu ra của AI sinh tạo đã hiện diện khắp môi trường ngôn ngữ, bất kể con người có trực tiếp dùng nó hay không
Ẩn dụ về thép nền phông thấp
- Low-background steel là thép được sản xuất trước vụ nổ bom nguyên tử đầu tiên, từng là loại vật liệu được săn tìm nhiều hơn cho một số mục đích nhất định
- Nhiều vụ thử hạt nhân trong thập niên 1940–1950 đã làm tăng vật chất phóng xạ trong khí quyển, và thép được sản xuất sau đó từng bị xem là không đủ “sạch” cho một số ứng dụng như máy dò hạt
- Tuy vậy hiện nay, do mức bức xạ nền nhân tạo toàn cầu đã giảm xuống, thép sản xuất gần đây dường như cũng có thể dùng cho hầu hết mục đích
- Trong phép ẩn dụ này, các bài viết sau ngày 30 tháng 11 năm 2022 được xem là đã được viết trong thời kỳ hậu phổ biến ChatGPT, nên ít nhiều đều chịu ảnh hưởng của LLM
- Trừ khi chỉ đọc nội dung cũ, rất khó để hoàn toàn tránh khỏi môi trường ngôn ngữ hậu LLM
Tiêu chuẩn viết sau thời LLM
- Càng nhiều nội dung sinh tạo chiếm chỗ trên Internet, nhu cầu về tư duy và cách diễn đạt độc đáo sẽ càng tăng, với cả từng cá nhân và các công ty mô hình
- Năng lực viết nội dung độc đáo mà không cần LLM có thể sẽ trở nên giá trị hơn
- Tuy nhiên, trong một môi trường ngập tràn các bài thought leadership kiểu LinkedIn và ảnh mèo do AI tạo ra, việc tìm được những bài viết như vậy lại trở nên khó hơn
- Trong thời gian dài, con người từng xem ngữ pháp tốt, vốn từ rộng, cách diễn đạt và ẩn dụ phù hợp, cùng bố cục chắc chắn là tiêu chuẩn của viết hay
- LLM nhìn chung đáp ứng được các tiêu chuẩn truyền thống đó, nhưng chúng lặp lại cùng một mẫu hình, cách diễn đạt trông cũ kỹ, ẩn dụ hơi lạc điệu, và dấu gạch ngang dài để lại ấn tượng xấu
Sự thay đổi của tiêu chuẩn viết hay
- Ngày nay, sinh viên có thể đứng trước lựa chọn: tự nỗ lực viết để nhận điểm trung bình, hoặc không làm gì cả mà vẫn nộp bài do ChatGPT viết để nhận điểm cao
- Có thể cho rằng nếu đưa một bài do Claude viết cho người của 10 năm trước xem, họ sẽ không có quá nhiều điều để phàn nàn
- Bài viết do LLM tạo ra sẽ lộ tính lặp lại nếu đọc lâu, nhưng vẫn phù hợp đáng kể với các tiêu chuẩn truyền thống của một bài viết “đúng chuẩn”
- Giờ đây, giá trị quan trọng hơn đang chuyển sang cách diễn đạt độc đáo
- Dù sai ngữ pháp nhưng nếu khác biệt thì vẫn có giá trị; dù vốn từ hạn chế nhưng nếu tránh được những từ ngữ lặp đi lặp lại kiểu LLM thì sẽ tạo cảm giác con người hơn
- Lỗi chính tả không còn chỉ là khuyết điểm đơn thuần, mà có thể được chấp nhận như một dấu vết con người giúp phân biệt với văn bản AI nhạt nhòa và khái quát hóa
Lời hứa sẽ viết mà không dùng LLM
- Chỉ khi độc giả bỏ thời gian để đọc và tác giả cũng bỏ thời gian để viết thì khế ước xã hội mới được thiết lập
- Một bài viết được tạo nên bằng cách bật một bộ phim cũ rồi dành phần lớn một ngày để hoàn thành có chứa trong đó nỗ lực tương xứng với thời gian của người đọc
- Viết lách là một hoạt động thú vị, và là điều đã gắn bó suốt đời, dù mức độ đều đặn có khác nhau
- Về sau sẽ có quyết tâm biến việc viết thành một thói quen thường nhật hơn, vì đó được xem là việc có ý nghĩa và đáng để làm
1 bình luận
Ý kiến trên Lobste.rs
Câu này trong Oxide RFD có vẻ là một cách diễn đạt ít gay gắt hơn, ít tiện để trích dẫn hơn so với meme ai;dr quen thuộc, nhưng lại tường minh hơn nhiều
Câu “khi không có LLM, người ta mặc định rằng giữa người đọc và người viết thì người viết đã bỏ ra nhiều nỗ lực trí tuệ hơn” rốt cuộc có nghĩa là “nếu anh không chịu bỏ công để viết, thì tôi cũng không chịu bỏ công để đọc”
Tôi không cảm nhận được chuyên môn từ những người viết chèn LLM vào công việc của họ
Mùi LLM này hoàn toàn giống như đang lớn tiếng hét lên rằng “tôi là kẻ tào lao không định làm việc của mình”. Trong phần mềm, có thể lập luận rằng đầu ra độ phân tán thấp, nhất quán, dễ đoán và nhàm chán là điều tốt, nhưng trong viết lách thì tôi thường thấy điều ngược lại
Ngược lại, tôi nghĩ chúng ta cần nhiều bài viết nhất quán, dễ đoán và nhàm chán hơn. Phần lớn hướng dẫn viết đều ưu tiên văn phong hơn là sự rõ ràng và tính chân thực. Không phải tôi muốn bênh vực việc viết bằng AI, tôi cũng không dùng AI để viết trực tiếp và cũng ghét cái mùi đó, nhưng tôi ước nhiều tác giả là con người hơn sẽ có can đảm để trở nên nhàm chán
Pull request cũng vậy. Trước đây phần lớn nỗ lực được dành cho việc suy nghĩ sâu về vấn đề và viết mã
Review cũng có thể rất tốn công, nhưng ít nhất vẫn có sự cân bằng, và dù có mất cân bằng thì cũng là khi review đồng thời đóng vai trò onboarding hoặc đào tạo. Nếu bạn quan tâm đến chất lượng dự án thì giờ phương trình đã thay đổi hoàn toàn. Những người thậm chí chẳng quan tâm gì đến nội bộ dự án giờ có thể xả PR ra nhanh hơn vài bậc độ lớn so với tốc độ có thể review
Thật đúng như vậy. Với review code, ít nhất còn có lợi thế là có thể chặn PR của người đóng góp mới bằng các hệ thống như
vouch. Nhưng với những thứ như bài viết blog, bạn cứ phải liên tục nghi ngờ liệu tác giả có thật sự hiểu và quan tâm, hay mình chỉ vừa đâm sầm vào thêm một bức tường slop nữa. Hiện tại slop vẫn còn khá dễ nhận ra, nhưng điều đó rất có thể sẽ thay đổi khi những kẻ sản xuất bắt đầu chỉ thị cho mô hình tránh các mẫu điển hình. Loại slop duy nhất mà tôi hoan nghênh là việc LinkedIn ngập trong các bình luận slopTrước đây nó đã là rác khoe mẽ rồi, và sau này vẫn là rác khoe mẽ. Chỉ là giờ có thêm ảnh AI phong cách hoạt hình thôi
Về cơ bản, những thứ được tạo trước năm 2022 thì tôi nhìn với ít nghi ngờ hơn nhiều. Những người biết chuyện thì còn thêm
before:2022vào tìm kiếm hình ảnhKhế ước xã hội quan trọng nhất khi đọc bài blog là việc tác giả sẽ tiếp tục cải thiện khả năng viết của mình thông qua chính trải nghiệm đó
Việc dùng LLM cũng phá vỡ điều đó. Chuyện dùng LLM để viết code thì còn có thể bàn luận, nhưng dùng LLM cho viết blog, nhất là blog, thì đơn giản là ghê tởm
Bài này đã diễn đạt rất tốt những suy nghĩ và cảm xúc tôi mang trong lòng bấy lâu. Đặc biệt là mong muốn về sự không hoàn hảo mang dấu ấn con người
Tôi muốn điều đó ở người khác, và cũng muốn tính người của mình hiện ra trong công việc của bản thân. Tôi đánh vần rất tệ nên thường bị bạn bè và đồng nghiệp chọc, và khi viết blog tôi từng nghiêm túc nghĩ đến việc cố tình để lại vài lỗi để cho thấy mình vẫn là con người. Tất nhiên, có lẽ như vậy cũng hơi quá
Tôi hoàn toàn đồng cảm với câu “tôi thích viết và đã viết cả đời, giờ tôi đang cố làm điều đó theo kiểu đều đặn hơn. Nó cho tôi cảm giác đây là việc có ý nghĩa và đáng làm”, nhưng tôi có hai nỗi sợ
Thứ nhất, nếu thấy ai đó tình cờ bắt đầu blog vào khoảng 2024/2025 hoặc bắt đầu đăng nhiều hơn, tôi sẽ mặc định phân loại rồi cất họ vào nhóm AI. Blog của tôi nhìn từ bên ngoài cũng sẽ có vẻ như vậy. Thứ hai, tôi không thích việc các bài viết của mình giúp các công ty AI tạo ra mô hình tốt hơn. Tuy vậy, một cách đạo đức giả, tôi cũng dùng AI mỗi ngày
Với vấn đề thứ hai, tôi không thấy rõ cách nào để giết được vô số gã khổng lồ. Với vấn đề thứ nhất, tôi mong sẽ xuất hiện một dạng bằng chứng lao động của con người nào đó để chứng minh rằng đã có đủ sự chú ý của con người đằng sau nội dung. Tôi từng nghĩ đến chuyện stream trên Twitch trong lúc viết, nhưng điều đó quá phi thực tế, và thật ra cũng khá xấu hổ nếu phải công khai quá trình viết, bao gồm những ý tưởng ngớ ngẩn, những khoảnh khắc nhận ra “cái mình đang viết hoàn toàn sai”, hay việc cứ diễn đạt lại vô tận để cho hợp gu. Tôi không nghĩ ra cách chứng minh nào khác
Hiện giờ tôi đang viết một bài blog kỹ thuật khá phức tạp, và toàn bộ các câu trong phần thân bài đều được tôi tự tay viết
Tôi đã cần thử vài lần để nắm được điều mình muốn nói, nhưng giờ cấu trúc có vẻ đã khá ổn. Phần tôi dùng Claude như một công cụ là chuyển phần mô tả văn bản thành sơ đồ Mermaid. Tôi biết ơn công sức đổ vào Mermaid, nhưng tôi thấy một số cú pháp quá khó hiểu, nhất là khi ra ngoài các cấu trúc chuẩn như flowchart hay sequence diagram. Tôi làm việc ở Oxide và cũng đã đóng góp ý kiến phần nào cho RFD 576