1 điểm bởi GN⁺ 18 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Trên Lobsters đã có các cuộc thảo luận về việc cấm bài viết do LLM tạo ra và đổi thẻ, nhưng dường như đã có đồng thuận rằng các bài đăng ít công sức, ít thông tin thì nên xử lý bằng cách báo cáo spam
  • Phản ứng chỉ để lại những câu như “this is LLM slop” trong phần bình luận bị cho là chỉ dừng ở việc phán đoán có phải nội dung do LLM tạo ra hay không, chứ không bàn đến nội dung bài viết, nên có đề xuất báo cáo là lạc đề
  • Ít nhất 80% lý do đọc Lobsters là vì chất lượng bình luận, nên việc phải lọc bỏ những tranh cãi xoay quanh chuyện một bài có phải đầu ra của LLM hay không gây khó chịu
  • Nếu một bài được gửi lên vì thấy thú vị mà bình luận duy nhất lại là kiểu “giá mà đây không phải bài do LLM viết” thì sẽ gây bức bối cho người gửi bài
  • Việc một bài tự viết bị nghi là nội dung do LLM tạo ra còn làm nản lòng hơn, và điều này đã từng xảy ra với tác giả ở nền tảng khác cũng như với những người viết khác trên Lobsters

Đề xuất

  • Dù các cuộc thảo luận về cấm bài viết do LLM tạo ra, đổi thẻ ai/vibecoding vẫn tiếp diễn, dường như đã có đồng thuận rằng các bài đăng ít công sức, ít thông tin thì cứ báo cáo là spam rồi bỏ qua
  • Có đề xuất rằng trong phần bình luận, những phản ứng chỉ để lại câu như “this is LLM slop” hoặc lời lẽ tương tự thì nên được báo cáo là lạc đề
  • Ít nhất 80% lý do đọc Lobsters là vì chất lượng bình luận, nên việc phải lọc đọc những tranh cãi kéo dài xem bài đang bàn tới có phải đầu ra của LLM hay không thật sự gây khó chịu
  • Nếu đã gửi một bài vì cho là thú vị mà bình luận duy nhất lại là kiểu “bài này hẳn đã hay nếu không phải do LLM viết” thì từ góc nhìn người gửi cũng rất bức bối
  • Một bài được tự tay viết, không dùng LLM, nhưng sau khi được đăng lại bị nghi là nội dung do LLM tạo ra thì còn bức bối và làm giảm tinh thần hơn nữa
  • Việc này không xảy ra với chính bài viết của tác giả trên Lobsters, nhưng tác giả từng nhận phản ứng như vậy ở nền tảng khác và cũng đã thấy điều tương tự xảy ra với những người viết khác trên Lobsters

Bối cảnh và ý định

  • LLM là một chủ đề gây phân cực trong cộng đồng và hiện khiến tất cả đều mệt mỏi, nên tác giả cho rằng ở thời điểm này khả năng mọi người thay đổi quan điểm của nhau là rất thấp
  • Trọng tâm của đề xuất là ngoài việc “cứ báo cáo các bài ít công sức là spam rồi bỏ qua”, còn nên “báo cáo các bình luận meta chỉ chăm chăm chỉ ra có phải LLM hay không là lạc đề rồi bỏ qua”
  • Vì tiêu chuẩn thế nào là “slop” ở mỗi người khác nhau, mục đích là giảm bớt những cuộc thảo luận trong bình luận bị kéo từ nội dung bài viết sang việc phán xét có phải do LLM tạo ra hay không

1 bình luận

 
Ý kiến trên Lobste.rs
  • Có thể tôi không thích, nhưng tôi vẫn thấy kiểu thông báo này đáng cảm ơn. Tôi không muốn tốn thời gian đọc bài viết được tạo ra, và tôi cảm thấy khi người ta giao việc viết cho công cụ thì họ sẽ đánh mất tiếng nói của chính mình, nên tôi cũng không muốn dính dáng đến cả kiểu viết “có hỗ trợ”
    Tôi đọc bài không chỉ để xem nội dung, mà còn để xem góc nhìn và văn phong của tác giả. Việc bài được viết như thế nào vì sao lại không liên quan cũng là một điểm đáng để bàn, và nó cho thấy rõ hơn tác giả đã tham gia vào công việc đó như thế nào
    Những tín hiệu sớm giúp tôi có thể đánh giá ngay từ đầu nên tiếp cận nội dung thế nào là có giá trị. Nếu không thích thì cứ bấm nút [-], còn tôi thì có thể dùng nút ẩn

    • Vấn đề lớn nhất là, nếu một bài nào đó là một bài nhảm dài 17 đoạn, mà phải đến khoảng đoạn thứ 10 mới nhận ra điều đó, thì tức là đã lãng phí không ít thời gian vào một bài giá trị thấp rồi
      Trong những trường hợp như vậy, sẽ rất tốt nếu có tín hiệu báo trước
    • Tôi hiểu việc ghét nội dung do LLM tạo ra, nhưng cách dùng LLM có một phổ mức độ rộng, từ “hãy tự tìm hết rồi viết cho tôi” cho tới “tôi không phải người bản ngữ, hãy giúp tôi dịch/chỉnh tiếng Anh”. Điều quan trọng hơn là không cần để mười mấy bình luận đầu của mọi bài đều tranh cãi xem có phải LLM viết hay không
      Tôi đã thấy cả những bài mà tác giả nói rõ là tự viết và cũng không có lý do gì để không tin, nhưng vẫn liên tục bị nghi là dùng LLM. Nếu bình luận cũng không thể nhận diện nội dung LLM một cách ổn định thì nó chỉ là nhiễu, và cùng lắm cũng tệ chẳng kém gì các bài báo AI nhảm nhí
  • Những bình luận cho biết bài gửi là do LLM tạo ra thì hữu ích, và tôi dựa vào những bình luận đó để báo cáo là spam rồi ẩn đi
    Tất nhiên tôi không tin nguyên xi các bình luận đó mà vẫn tự kiểm tra

  • Nếu có thể báo cáo mục đó là bài nhảm/spam thì kiểu bình luận này sẽ biến mất

    • Những bình luận này rõ ràng đang lách qua sự thiếu sót của hệ thống báo cáo. Spam được định nghĩa là có yếu tố thương mại, nên nếu hiểu đúng theo định nghĩa thì nhiều bài nhảm không khớp
      Không sửa chức năng báo cáo mà chỉ cấm bình luận thì không có ý nghĩa. Cần xử lý nguyên nhân gốc rễ chứ không phải triệu chứng
    • Tôi có tuổi rồi nên có lẽ không nhận ra ‘bài nhảm’ theo bản năng tốt như những người khác. Có thể là vì bài nhảm trông giống mấy thứ tiếp thị vớ vẩn do con người viết vài năm trước, nên với tôi nó không có vẻ là một hiện tượng khác biệt
      Với tôi, việc có những cuộc tranh luận dài dòng về nguồn gốc của thứ trông chỉ như một bài viết bình thường nhưng dở khá là khó chịu. Càng khó chịu hơn khi trong đó lại có những thông tin hữu ích bị chôn vùi
      Tôi tự hỏi liệu có thể có cách để mỗi người để lại một điểm số riêng về chất lượng bài viết hoặc mức độ ‘nhảm’, tách biệt với upvote/downvote về độ thú vị của bài hay không. Sau đó lấy trung bình, và người dùng cũng có thể đặt ngưỡng tự động ẩn
      Có thể việc đó sẽ khiến lobste.rs phức tạp hơn so với mục đích ban đầu, nhưng để đối phó với bối cảnh khá phản địa đàng mà chúng ta đang sống thì biết đâu lại hợp lý
    • Chẳng phải đã có thể báo cáo là spam rồi sao? Tôi vẫn hay làm thế
  • Bình luận kiểu “đây là bài nhảm do LLM tạo” đã nhiều lần giúp tôi tiết kiệm thời gian, và ít nhất một bài tôi tự đăng cũng từng như vậy. Tôi không muốn đọc bài nhảm, và càng không muốn đăng bài nhảm

  • Với tư cách người đọc, những bình luận đó hữu ích. Đặc biệt khi họ chỉ ra vì sao họ nghĩ như vậy thì còn hữu ích hơn một báo cáo đơn thuần
    Định nghĩa báo cáo “spam” trên trang about như sau:

    For stories, these are: "Off-topic" for stories that are not about computing; "Already Posted" for duplicate submissions and links that elaborate on or responses to a thread that's less than a week old (see merging); and "Broken Link" for links that 404, 500, or present a paywall; "Spam" for links that promote a commercial service.
    So sánh định nghĩa đó với hành vi được đề xuất, và với hành vi mà trước đây tôi thấy ít nhất một quản trị viên từng ủng hộ, thì tôi nghĩ tốt hơn là cứ để những bình luận này tiếp tục tồn tại
    Mong muốn tránh bài nhảm còn lớn hơn mong muốn tránh content marketing. Content marketing thì dễ đặt vào ngữ cảnh hơn và chỉ báo cáo thôi cũng đã cung cấp đủ thông tin. Cho đến khi có mục báo cáo riêng cho bài nhảm, tôi hy vọng các bình luận như vậy, đặc biệt là các bình luận có căn cứ, vẫn tiếp tục được cho phép

    • Cá nhân tôi dùng từ “spam” rộng hơn định nghĩa trên trang about. Không chỉ là kiểu “UCE” ngày xưa, tức email thương mại không mong muốn, mà cả những bài kích động dài dòng sao chép-dán từng phủ kín một số nhóm Usenet, tôi cũng xem là spam
      Đó là những bài do những người ám ảnh hoặc troll đăng để phá rối nhiều luồng thảo luận. Nội dung chất lượng thấp do LLM tạo ra không khác gì loại nội dung đó
  • Vậy còn những bài mà ai đó chỉ nhờ LLM sửa ngữ pháp hay chính tả thì sao? Còn trường hợp ai đó viết một lập luận mạch lạc bằng tiếng Tây Ban Nha rồi nhờ LLM dịch thì sao? Còn trường hợp một người có thể bị chứng khó đọc đưa ra danh sách bullet chính rồi nhờ LLM diễn đạt thành bài văn thì sao?
    Tôi mong mọi người đừng đơn giản hóa một vấn đề tinh tế như thế. Có nguy cơ loại bỏ những đóng góp thú vị. Tất nhiên tôi cũng không muốn thấy ở đây những bài nhảm hoàn toàn không có giá trị thông tin, hay tệ hơn là những ảo giác sai sự thật

    • Ưu và nhược điểm của văn bản do LLM tạo ra đã bị bàn đi bàn lại đến phát chán rồi. Điều tôi muốn chỉ là ngừng cuộc tranh cãi đó trong phần bình luận. Hãy báo cáo là spam rồi bỏ qua, hoặc cứ để yên vậy thôi
  • Cá nhân tôi thấy cả hai phía đều có lý. Dưới đây không phải lập trường chính thức của trang mà là suy nghĩ riêng của tôi, và cũng chưa phải kết luận được sắp xếp kỹ lưỡng gì. Tôi chỉ chia sẻ suy nghĩ hiện tại xem có giúp ích cho thảo luận không
    Lý do người ta muốn biện pháp này là hợp lý và tôi đồng cảm. Một bài viết được đầu tư công sức mà lại bị xem như hoàn toàn không có sự tham gia của con người thì thật sự rất làm nản lòng. Nhất là nếu bị quy như vậy chỉ vì những lý do bề mặt như em dash thì lại càng thế. Nếu là tôi thì chắc cũng nhanh chóng muốn rời đi
    Tuy vậy, bản thân biện pháp đó có thể không phải là cách lý tưởng nhất để đạt mục tiêu ấy. Tác động của kiểu can thiệp như vậy có vẻ sẽ là đánh mất tuyến phòng thủ lớn nhất trước nội dung không có con người. Khi mọi người cùng tạo ra các chuẩn mực xã hội và áp dụng chúng một cách nhất quán, nó mở rộng tốt hơn rất nhiều so với việc thực thi quyền lực từ trên xuống. Vì thế tôi rất thận trọng với việc kìm hãm một động lực xã hội đang đóng vai trò quan trọng ở thời điểm này. Kể cả khi nhìn thấy tác hại, tôi vẫn muốn xem lại sau nếu về sau vai trò đó bớt quan trọng hơn
    Có biện pháp nào khác có thể hữu ích không? Nếu còn đề xuất nào chưa được nêu ở đây, tôi rất mong mọi người cứ đưa ra
    Dĩ nhiên tôi cũng mong mọi người cẩn thận để không tung ra những lời buộc tội bừa bãi khi mức độ chắc chắn còn thấp. Dù bạn tin vào chính nghĩa nào đi nữa, kiểu phản ứng cẩu thả, bốc đồng cũng rất phá hoại. Nếu mọi người cứ liên tục nhất thời công kích cá nhân nhau, thì khó có không gian nào còn giữ được tính cộng đồng

  • Tôi hoàn toàn đồng ý. Nhiều khi tôi đọc một bài mà hoàn toàn không thấy cảm giác nó do AI tạo ra, nhưng lại có người quả quyết là như vậy. Có thể tôi sai, nhưng làm sao có thể biết chắc cái gì là do AI tạo ra?
    Nếu đúng là bài nhảm thật thì tôi nghĩ mọi người sẽ không upvote, và như vậy nó sẽ tự nhiên được điều chỉnh

    • Tôi không chắc văn bản do AI tạo ra có những đặc điểm bản chất mà con người, hay phần lớn con người, lúc nào cũng buộc phải nhận ra. Cuối cùng có thể gần như sẽ không còn cách nào phân biệt chỉ từ văn bản nữa. Nếu vậy, một bài do LLM viết mà không ai nhận ra thì nó có phải là “bài nhảm thật sự” không?
      Khi mọi người nói họ muốn góc nhìn và sự thấu suốt của tác giả, thì trong đó thật sự có một điều gì đó quan trọng. Ngay cả khi ai đó dùng LLM, không có trợ giúp nào của con người ngoài prompt, để tạo ra một bài blog giả tưởng, và bài đó tình cờ nhất quán, đúng sự thật và được viết hấp dẫn, thì tôi vẫn không đặc biệt muốn đọc nó. Ít nhất là trong bối cảnh lobsters
      Có thể tồn tại một nền tảng để đọc loại nội dung đó, kiểu như một bách khoa thư văn bản LLM mà tôi bước vào với nhận thức rõ bản chất của nó. Nhưng tôi nghĩ nó không phù hợp với một cộng đồng được tạo ra từ tư duy và sáng tạo của con người
      Điều này hiện tại không ảnh hưởng nhiều đến bản thân bài viết. Vì tôi không thể tự tin nói những bình luận kiểu “ngửi thấy mùi LLM” thực sự chính xác đến đâu. Dù vậy, tôi rất đồng cảm với mong muốn của các thành viên cộng đồng là muốn có sự yên tâm rằng mình đang đọc một bài viết do một con người có chủ ý tạo ra
  • Hơi tách khỏi đề xuất này một chút, nhưng tôi thắc mắc vì sao đề xuất này lại đang bị báo cáo là lệch chủ đề hay spam. Có vẻ nó không khớp với tiêu chí nào cả?
    Tôi biết phần about có nói rõ là kiểu câu hỏi meta như thế này không được hoan nghênh, nhưng tôi thật sự tò mò không biết mình có bỏ sót gì không

    • Trên trang này có khá nhiều tay buôn bài nhảm là con người cứ hễ không thích bài nào là gắn lệch chủ đề hoặc spam cho bất kỳ bài nào. Thật bực mình. Trước đây cũng đã từng có: https://lobste.rs/s/irxjid/ai_vampire#c_d0zhhi
  • Có lẽ sẽ có những blogger không phải người bản ngữ tiếng Anh dùng AI để trau chuốt ngôn ngữ cho bài blog của họ. Những người quen tiếng Anh hơn có thể nhận diện các văn bản như vậy là bài nhảm AI, nhưng thực ra đó có thể chỉ là một dạng hỗ trợ viết
    Bản thân tôi cũng không phải người bản ngữ tiếng Anh nên không giỏi nhận ra những văn bản như thế có dùng AI hay không. Điều quan trọng nhất với tôi là thông điệp cốt lõi được truyền đạt như thế nào

    • Chủ đề meta này không phải để bàn về việc vì sao mọi người dùng hay không dùng LLM. Điều tôi muốn là đừng phải thấy thêm trong mọi luồng bình luận ở đây những cuộc cãi vã kiểu “cái này do robot tạo ra!” “không phải” “phải, quá rõ rồi”. Tất nhiên tôi đang nói hơi quá lên một chút thôi