- Có nhiều thảo luận về cách xử lý khi đăng bài viết do LLM tạo ra lên trang, nhưng dường như chưa có chính sách rõ ràng quy định việc có cho phép hay không
- Quan điểm được nêu là những người dùng thường xuyên đăng bài do LLM tạo ra nên bị chặn khỏi trang
- Có đề xuất hiển thị thông báo trên trang gửi bài rằng “Bài viết do LLM tạo ra không được phép ở đây”
- Chính sách và thông báo rõ ràng có thể giảm tranh cãi xoay quanh việc gắn cờ hay phản hồi bằng bình luận đối với các bài viết do LLM tạo ra
- Cốt lõi là thiết lập một tiêu chuẩn minh thị rằng không chấp nhận các bài gửi do LLM tạo ra để đơn giản hóa cách cộng đồng ứng phó
1 bình luận
Ý kiến trên Lobste.rs
Thỉnh thoảng có bài kém chất lượng lọt vào thì có vẻ cũng không sao. Nếu ghi rõ cấm nội dung do LLM tạo ra, thì lý tưởng là sẽ có cơ sở rõ ràng để giảm bớt bài linh tinh trên trang đầu và cấm những người tái phạm nhiều lần, mà không cần tranh cãi về các điều khoản ngoại lệ trong phần bình luận
Nhìn chung là đồng ý. Nếu là bài mà người ta còn không buồn tự viết, thì tôi cũng không muốn đọc
Tuy vậy, tôi không biết cách nào để nhận diện câu văn do LLM tạo ra một cách hoàn hảo, và tôi không thích việc cấm một người hay một nguồn chỉ vì bài đăng của họ có thể đã được tạo ra. Có lần tôi còn bị nghi dùng LLM chỉ vì thỉnh thoảng dùng em dash, trong khi tôi đã viết như vậy hơn 25 năm rồi
Không thể vì việc phát hiện bài kém chất lượng không hoàn hảo mà lại không lập chính sách. Sai sót thỉnh thoảng sẽ có, nhưng nhất định phải tạo áp lực ngược lại với đống rác do LLM tạo ra đang phủ khắp web và đẩy bài do con người viết ra ngoài
Đồng ý
Thường thì việc một bài có phải là bài do LLM tạo ra hay không khá là rõ, và tôi cũng từng thấy trường hợp tác giả không ghi trong bài nhưng lại có chỗ khác trên site của họ nói rõ có dùng LLM. Khi đó việc đánh giá càng dễ hơn
Khả năng cảm nhận bài kém chất lượng của cộng đồng cũng có vẻ khá chính xác. Tôi không nhớ có trường hợp nào thực ra không phải nhưng tác giả lại bị cả một luồng bình luận lớn quy kết là dùng LLM. Nếu không ai phân biệt được thì đơn giản là không ai phân biệt được
Với những trường hợp thực sự mơ hồ thì cứ mặc định thiện chí cũng được. Những thứ gây vấn đề thường là các bài quá lộ liễu, chứ không phải tình huống ai đó lừa lobsters để nhét vào càng nhiều bài LLM càng tốt mà không ai phát hiện ra
Tôi thực sự ghét bài viết do LLM tạo ra và mong chúng biến mất. Những trường hợp cực đoan như vậy khá rõ ràng và có lẽ cũng dễ nhận diện, và tôi nghĩ rất ít người phản đối việc loại bỏ chúng
Tuy nhiên, nếu ai đó gửi một phần mềm có chấp nhận một số commit do LLM tạo ra thì sao. Hoặc nếu một thứ được làm hoàn toàn bằng LLM nhưng quá trình đó lại được ghi chép thành một bài phân tích thì sao. Những phản biện này phần nào là cố tình đóng vai luật sư của quỷ, nhưng rõ ràng ngay trong lobsters cũng có cả một phổ các mức độ chấp nhận
Tôi nghĩ việc cấm toàn bộ mọi nội dung chỉ cần có chút dính dáng đến LLM sẽ khó được chấp nhận. Câu trả lời dễ được chấp nhận rộng rãi nhất có lẽ là một cờ không bị trừ karma. Kiểu như để lại tín hiệu cho người xem sau rằng “theo tôi thì đây là nội dung tạo sinh, hãy lưu ý”. Thực ra các luồng bình luận lớn hiện giờ đang làm gần như đúng vai trò đó, và có thể vừa giảm cãi vã trong bình luận vừa phát ra tín hiệu về mức độ nên hiển thị nội dung
Nghe hợp lý. Nếu ai đó không bỏ thời gian để sắp xếp suy nghĩ của mình, thì tôi cũng thấy chẳng có lý do gì để mình phải bỏ thời gian đọc
Dùng chatbot như một con vịt cao su để gọt lại lập luận hoặc kiểm tra ngữ pháp thì không sao. Tôi không nghĩ cần đến mức phải phát hiện đặc biệt gì, chỉ cần kỳ vọng của cộng đồng và xóa những trường hợp quá rõ ràng là đủ
Rất dễ vừa thấy bài mình không thích là lập tức hét lên “bài rác LLM!”. Rồi chuyện gì sẽ xảy ra. Tôi muốn nhìn thấy cả những bài đúng chủ đề mà tôi đồng ý lẫn không đồng ý, và điều đó mới là lành mạnh
Tôi không chắc người ta sẽ đánh giá “kém chất lượng” như thế nào. Có ví dụ rõ ràng, nhưng cũng có ví dụ mơ hồ. Cũng có thể một bài hợp lệ trông lại cẩu thả chỉ vì tác giả tình cờ dùng một kiểu văn phong mà LLM hay bắt chước
Trong các bài gửi theo kiểu “authored by”, việc nhìn vào mức độ cẩu thả nói chung của người gửi có thể là công bằng. Nếu ai đó liên tục đăng bài rõ ràng là kém chất lượng thì có thể đánh dấu họ là cẩu thả, ban quản trị liên hệ bảo “dừng lại”, rồi nếu vẫn không dừng thì cấm
Tôi không rõ có nên tính tương tự với “bài cẩu thả” được gửi thông qua người khác hay không. Có vẻ vẫn hợp lý khi không cấm khả năng đăng bài của người cứ liên tục gửi nội dung mà bài viết trông kém chất lượng, mà chỉ tạm thời hạ nhiệt. Nhưng một cơ chế mà mọi người gửi bài đều có thể bị cấm nếu không bảo vệ được nguồn gốc bài viết thì sẽ không vui chút nào
Có vẻ bạn đang đánh giá thấp mức độ phản xã hội của việc viết bài rác LLM. Ngay lúc này những trường hợp rõ ràng như thế vẫn nằm trên trang đầu nhiều ngày vì được những người chạy theo trào lưu AI đăng lên
Bài liên quan: https://lobste.rs/s/wee21u/this_is_written_by_llm_comments_should_be
Ví dụ:
https://lobste.rs/s/ojvhq9/coding_is_thinking_why_i_still_write_code
https://lobste.rs/s/eaxtmb/claude_for_legal_suite_plugins_for_legal
https://lobste.rs/s/fvqkke/new_claude_code_programmatic_usage
Đồng ý rằng cần có khả năng lọc hoặc gắn cờ văn bản do LLM tạo ra
Vấn đề là nếu đó là bài do LLM tạo ra nhưng thực ra vẫn đúng chủ đề, thì việc dán nhãn là “lạc đề” sẽ trở nên mâu thuẫn. Trước đây cũng từng có thảo luận về lựa chọn gắn cờ mới. Ví dụ: https://lobste.rs/s/po97lh/new_tag_suggestion_genai_assisted
Tôi vẫn cho rằng tùy chọn cờ mới tốt hơn là lạm dụng cờ “lạc đề”, như đã được bàn ở https://lobste.rs/s/rkjpob/proposal_add_ai_generated_as_flag_reason
Khả năng lọc hay gắn cờ có vẻ không quan trọng lắm với tôi. Người dùng đăng thứ đó nên bị loại khỏi site. Cờ hay thẻ mà không dẫn đến hành động thực tế thì chỉ là lãng phí
Có lẽ tôi đang chỉ chọn những ví dụ vô giá trị để nói tới, nhưng văn bản do LLM tạo ra ở https://lobste.rs/s/hfnps5/osmand_s_faster_offline_navigation nhìn chung dù chất lượng rác thì vẫn có nội dung riêng đúng chủ đề ở trong đó
Giờ thì mọi loại dấu gạch ngang đều là bất hợp pháp
--Mối lo là: không dễ để biết một văn bản có phải do LLM tạo ra hay không với độ chính xác tuyệt đối. Tuy vậy trong đa số trường hợp thì điều đó khá rõ ràng
Thỉnh thoảng sẽ có bài do LLM tạo ra nhưng bằng cách nào đó vẫn “quan trọng” hoặc “đáng chú ý”. Ví dụ như báo cáo CopyFail
Đề xuất: nên cấm nội dung do LLM tạo ra, trừ những tình huống ngoại lệ như lỗ hổng bảo mật có tác động lớn. Khi đánh giá một văn bản có phải do LLM tạo ra hay không thì nên tiếp cận thận trọng, và với các trường hợp giáp ranh nên cho lợi ích của sự nghi ngờ thay vì kết luận vội. “Tình huống ngoại lệ” có thể để ban quản trị toàn quyền quyết định, hoặc khi chính sách phát triển dần thì lập danh sách các điều kiện đó và tiếp tục tinh chỉnh lặp lại