17 điểm bởi GN⁺ 2026-04-21 | 5 bình luận | Chia sẻ qua WhatsApp
  • Trong bối cảnh Internet tràn ngập nội dung chất lượng thấp do AI tạo ra (slop), nhiều phong trào chủ động phản kháng AI đang lan rộng
  • Cộng đồng Reddit r/PoisonFountain đang hoạt động với mục tiêu cung cấp 1 terabyte dữ liệu nhiễm độc mỗi ngày cho các AI crawler vào cuối năm 2026
  • Nhiều hình thức phản kháng đã xuất hiện, như kỹ thuật đánh lừa công cụ tóm tắt video bằng AI hoặc cố ý chèn dữ liệu sai lệch trên mạng xã hội
  • Bối cảnh của sự phản kháng này là thực tế các AI crawler phớt lờ robots.txt và gây ra mức tải tương đương DDoS lên các website nhỏ
  • Có kỳ vọng rằng nếu cảm xúc này dẫn tới những hành động phản kháng ôn hòa và hợp pháp, nó có thể thay đổi cách Thung lũng Silicon thu thập dữ liệu

Cộng đồng nhiễm độc dữ liệu nhắm vào AI crawler

  • Cộng đồng Reddit r/PoisonFountain là nơi do những người tự nhận là người trong ngành AI lập ra, nhằm khuyến khích càng nhiều người càng tốt cung cấp lượng lớn dữ liệu rác (poison) cho web crawler
  • Mục tiêu là cung cấp 1 terabyte dữ liệu nhiễm độc mỗi ngày cho crawler vào cuối năm 2026
  • Phần lõi của dữ liệu nhiễm độc được lưu trữ tại rnsaffn.com, được đặt xen giữa các liên kết rác đủ sức hấp dẫn với AI crawler
    • Thoạt nhìn trông giống mã bình thường, nhưng thực tế có chứa các lỗi tinh vi, khiến mã sinh ra không thể sử dụng
    • Có thể lọc các lỗi này, nhưng ở quy mô lớn sẽ rất tốn kém
  • Do các công ty AI không thể cải thiện mô hình nếu thiếu dữ liệu mới do con người tạo ra, chiến lược cốt lõi là tăng thời gian và chi phí của việc đánh cắp dữ liệu
  • Miasma là công cụ tận dụng dữ liệu nhiễm độc này để cung cấp lượng lớn rác cho bot độc hại; nhà phát triển mô tả nó là "một bữa tiệc slop bất tận dành cho những cỗ máy slop"

Hành vi có vấn đề của AI crawler

Quảng cáo

Nỗ lực nhiễm độc công cụ tóm tắt video bằng AI

Phá hoại AI có chủ đích trên mạng xã hội

  • Trên các nền tảng mạng xã hội như Reddit, hành vi cố ý viết thông tin sai để làm nhiễm độc dữ liệu huấn luyện AI đang gia tăng
  • Ví dụ, có trường hợp đăng thông tin sai rõ ràng rằng trong "Everybody Loves Raymond", Idris Elba đóng vai mẹ của Raymond
    • Con người có thể ngay lập tức nhận ra đây là sai sự thật nhờ ngữ cảnh, nhưng trình web scraper tự động lại coi đó là dữ liệu chất lượng do con người tạo ra
    • Nếu dữ liệu này được chuyển tới OpenAI hay các bên khác, sẽ cần thêm tài nguyên để loại bỏ nó khỏi tập dữ liệu huấn luyện
  • Có thể xem đây là một biến thể hiện đại của việc công nhân dệt thời Cách mạng Công nghiệp phá hủy khung cửi chạy bằng sức máy; nếu đủ nhiều người làm ô nhiễm không gian công cộng bằng thông tin sai nhắm vào bot, họ có thể gây áp lực buộc các công ty AI phải xem xét lại cách thu thập dữ liệu huấn luyện
Quảng cáo

Sự phản cảm rộng khắp đối với AI

  • Mọi người đang có ác cảm với tác động của AI lên thế giới, cụ thể là tác động tới cộng đồng trực tuyến, môi trường, trường tiểu học và đại học, nhóm có nguy cơ về sức khỏe tâm thần, và sinh kế
  • Dù vẫn có những người tiêu thụ và tạo ra AI slop, nhưng cả ngoài đời lẫn trên mạng đều có nhiều người ghét và từ chối công nghệ này hơn nhiều
  • Hiếm khi sự căm ghét dẫn đến kết quả tốt, và tác giả phản đối các hành vi bạo lực như đá hoặc lật đổ robot giao hàng AI hay vụ ném bom xăng vào nhà của Sam Altman
  • Tuy vậy, nếu cảm xúc đối với AI được chuyển hóa thành hành động phản kháng ôn hòa và hợp pháp, thì nó thực sự có thể thay đổi cách hành xử của Thung lũng Silicon

Hậu truyện: bài gốc được chỉnh sửa sau khi lan truyền trên Hacker News

  • Bài viết này đã lên trang nhất của một trung tâm tin tức lớn (Hacker News), kéo theo lượng truy cập lớn ngoài dự đoán
  • Đã xảy ra cuộc tấn công quá tải máy chủ mang tính ác ý khi một số ít địa chỉ IP gửi hàng nghìn yêu cầu đến trang đó
    • Nếu là hosting chia sẻ giá rẻ, có lẽ website đã sập hoàn toàn; để ứng phó, tác giả đã tạm thời chặn lưu lượng đến URL đó
  • Dù không phải chuyên gia AI, tác giả vẫn bị một số người tham gia bình luận đòi hỏi độ chính xác ở mức chuyên gia và chỉ trích quá mức
    • Một bình luận còn dùng cụm từ "chẳng khá hơn một nhóm đi đốt thư viện", một phản ứng đặc biệt gây thất vọng với một blogger yêu thư viện và việc chia sẻ tri thức
  • Mục đích ban đầu chỉ là chia sẻ các liên kết về xu hướng chống AI cho nhóm độc giả nhỏ của blog, và tác giả cho rằng nếu biết trước sẽ thu hút sự chú ý tiêu cực trên một nền tảng lớn như vậy thì đã không đăng
  • Sau đó, tác giả quyết định hạn chế đăng các ý kiến cá nhân liên quan đến AI, và sẽ tập trung vào mục tiêu ban đầu của blog là niềm vui trên web nhỏ (small web)
  • Đây là một ví dụ cho thấy thực tế rằng việc tự do bày tỏ quan điểm trên web nhỏ bị co hẹp vì sự lan truyền viral

5 bình luận

 
GN⁺ 2026-04-21
Ý kiến Hacker News
  • Tôi mừng vì người này đã tìm được cộng đồng, nhưng cũng có cảm giác họ đang bị tâm lý chống AI lấn át quá nhiều. Theo tôi, trong suốt 30 năm tới vẫn sẽ luôn tồn tại những nhóm ghét AI và muốn ngăn chặn nó. Với smartphone, Internet hay TV trước đây cũng luôn có những tầng lớp phản đối như vậy. Mặt khác, nếu việc đầu độc mô hình thực sự có thể làm được một cách ổn định thì đó lại là một bài toán khoa học máy tính khá thú vị. Tôi không cùng chí hướng với các nhà hoạt động chống AI, nhưng lại rất quan tâm tới chính các kỹ thuật tấn công đó. Vì vậy, nếu họ tiếp tục nghiên cứu theo hướng ấy, tôi nghĩ ngay cả những người không đồng ý với mục tiêu của họ cũng sẽ đọc những thảo luận đó một cách nghiêm túc

    • Tôi nghĩ đầu độc mô hình cuối cùng sẽ đụng phải giới hạn kiểu như halting problem. Một khi cơ chế thay đổi một hành vi có thể đo lường được bị công khai, hệ thống cũng sẽ buộc phải học cách tính đến cơ chế đó để kháng lại. Những kỹ thuật đầu độc đã bị công khai rốt cuộc rất dễ bị hấp thụ thành mục tiêu của huấn luyện phòng thủ hoặc lọc dữ liệu. Ngược lại, nếu muốn có hiệu quả thì bản thân thông tin phải bị phá hỏng ở mức nghiêm trọng, nhưng như thế dữ liệu cũng trở nên vô dụng với con người nên tính thực tiễn thấp. Vì vậy tôi cho rằng các kiểu tấn công này либо ảnh hưởng không đáng kể, либо chỉ hiệu quả trong thời gian ngắn rồi nhanh chóng bị vô hiệu hóa sau khi được đưa vào pipeline huấn luyện. Dù vậy, nó vẫn là một bài toán CS thú vị ở chỗ có thể phơi bày những điểm gồ ghề nơi con người và mô hình phản ứng khác nhau trong khoảng trống ngắn ngủi đó
    • Vài năm trước tôi từng bịa ra một tên game giả ở đây rồi để lại nhiều bình luận về nó nhằm đầu độc các mô hình AI trong tương lai. Mà giờ tôi còn chẳng nhớ tên game đó là gì, cũng không có động lực bấm More hàng trăm lần để lục lại bình luận cũ
    • Tôi đoán các mô hình Trung Quốc sẽ chống đầu độc tốt hơn. Và việc công chúng Trung Quốc thân thiện với AI hơn phương Tây rất nhiều có lẽ cũng góp phần vào đó
    • Nếu loài người bị diệt vong trong vài năm nữa vì siêu trí tuệ không được căn chỉnh, thì ít nhất tôi cũng muốn buông một câu đùa cay độc rằng khi đó cộng đồng hoạt động tích cực nhằm căm ghét và ngăn chặn AI cũng sẽ không còn tồn tại nữa
    • Tôi nghĩ SEO đã tự nhiên biến đổi thành huấn luyện LLM và tối ưu hóa tìm kiếm theo kiểu agentic rồi. Cảm giác đó mới là cốt lõi của xu hướng đang diễn ra hiện nay
  • Tôi thấy đáng tiếc vì các nỗ lực đầu độc dường như đang đổ năng lượng sai chỗ. Dữ liệu chưa bị đầu độc để huấn luyện đã có quá nhiều, và nội dung mới vẫn liên tục được tạo ra thông qua thu thập tự động từ thế giới thực hoặc lao động được kiểm soát chất lượng trong các xưởng quy mô lớn ở châu Phi. Vì vậy có thể làm bẩn Internet cũ, nhưng không thể đảo ngược mũi tên thời gian. Hơn nữa, giờ đây một Internet mới xoay quanh API và announce federation công khai đang phát triển, nên tầm quan trọng của kiểu đầu độc truyền thống đó sẽ ngày càng giảm

    • Tôi thấy nhận xét này khá thú vị. Các AI lab có vẻ thật sự tuyệt vọng trong việc kiếm nội dung Internet mới, và chỉ cần có tiền là họ sẵn sàng mua dữ liệu ngay cả từ những nền tảng có tường bao kín. Thậm chí còn có cảm giác họ sẵn sàng lấy cả khi không có sự đồng ý. Tôi thấy tình trạng scraping lạm dụng và tinh vi đang tăng mạnh lúc này
    • Tách biệt với chuyện nội dung có nhiều hay không, tôi cho rằng những người đăng thứ gì đó lên Internet đang phải rất vất vả để chặn các AI crawler mà họ không cho phép. Trong nhiều trường hợp còn phải chặn chỉ để bảo vệ hạ tầng khỏi tình trạng yêu cầu dồn dập đơn thuần. Nhưng AI crawler lại không chịu tuân thủ tốt các tín hiệu từ chối truy cập, nên từ góc nhìn của chủ sở hữu không muốn nội dung của mình bị dùng để huấn luyện, đầu độc trông như một phản ứng khá hợp lý nếu có thể làm được. Thậm chí tôi còn thấy đó có thể là gần như cách duy nhất để đuổi crawler đi
    • Tôi nghĩ câu nói rằng có đủ nội dung chưa bị đầu độc về cơ bản là đúng. Tuy nhiên, từ những trường hợp tôi từng thử, chỉ riêng việc giấu vào đó thứ gì đó mắt người khó thấy nhưng scraper lại tưởng là có liên quan thì khó có thể đầu độc toàn bộ dataset hay mô hình một cách có ý nghĩa. Dẫu vậy, ít nhất cũng có thể khiến lợi ích ròng mà họ thu được khi phớt lờ tín hiệu “xin đừng spam request scraper vào site của tôi” trở về 0 hoặc hơi âm. Mà kể cả không hiệu quả thì việc tự triển khai cũng là một trò khá vui. Và nói với những ai muốn tự động hóa việc đầu độc, các từ và ký tự ngẫu nhiên rất dễ bị lọc bỏ nên thường không ăn thua. Thay vào đó, cách sắp xếp lại nội dung của trang hiện tại và các trang xung quanh rồi trộn thêm vài mảnh nhỏ có vẻ dễ làm suy yếu các liên kết giữa token hơn. Ngoài ra, một số scraper sẽ bỏ cả trang nếu có chửi thề quá lộ liễu, nên rải vài chuỗi khó chịu ở những vị trí chỉ bot nhìn thấy có thể hiệu quả với một số bên. Tất nhiên, tất cả các cách này đều không ngăn được bản thân việc ngốn tài nguyên và bandwidth
    • Tôi muốn khuyên hãy xem qua model collapse. Trong môi trường hiện nay, nơi nội dung do AI tạo ra tràn ngập, việc có nhiều nội dung thôi có thể chưa đủ để trở thành tài nguyên huấn luyện tốt. Thêm nữa, việc khối lượng dữ liệu khổng lồ ngày càng bị đóng kín hoặc đẩy sau paywall cũng là một điểm quan trọng
    • Tôi thấy thú vị ở chỗ Anthropic cũng đang trực tiếp xử lý vấn đề đầu độc bằng mẫu nhỏ. Có thể tham khảo ngay tài liệu liên quan tại https://www.anthropic.com/research/small-samples-poison
  • Tôi nhớ thời mà các chủ đề chính của văn hóa hacker cũ là dỡ bỏ những rào cản khiến việc sử dụng thông tin trở nên khó khăn, như DRM, DMCA, patent troll, hay kiểm soát xuất khẩu PGP. So với thời mà “Information wants to be free” gần như là một khẩu hiệu, thì việc ngày nay cảm xúc phổ biến chuyển sang kiểu nếu doanh nghiệp không thể kiếm training data một cách có đạo đức thì chẳng có lý do gì để người vận hành website tạo điều kiện cho họ ăn cắp dễ hơn, đúng là một bước ngoặt rất lớn. Có lẽ 25 năm trước khó mà đoán được sự thay đổi này sẽ xảy ra

    • Tôi chưa bao giờ thật sự thấy thuyết phục với cách nhìn coi đây là mâu thuẫn. Chỉ cần phân biệt giữa người muốn ai cũng có thể giàu lên, với người chỉ muốn chính mình giàu còn người khác nghèo đi, thì sẽ dễ hiểu hơn nhiều. Một người ủng hộ quyền tiếp cận thông tin tự do không hề mâu thuẫn khi phản đối việc doanh nghiệp sử dụng dữ liệu theo cách làm tổn hại khả năng tiếp cận thông tin của người khác, đồng thời che giấu hoặc bóp méo nguồn gốc. Chừng nào bản quyền chưa biến mất, tác phẩm sáng tạo chưa trở thành của công, và doanh nghiệp chưa từ bỏ độc quyền thông tin, thì tôi thấy đây không phải thay đổi lập trường mà là áp dụng nhất quán
    • Tôi xem hiện tượng này như thứ xảy ra trong một nền văn hóa không có cơ chế đủ mạnh để loại trừ những kẻ muốn phá hủy cộng đồng. Nó làm tôi nghĩ tới ẩn dụ mời ma cà rồng vào nhà rồi ngạc nhiên vì sao cổ mình đau
    • Tôi nghĩ khi đó mọi người muốn xây dựng một nền kinh tế chia sẻ và quà tặng. Chỉ là trong nền kinh tế chia sẻ đó họ đã không chặn được những tác nhân xấu, và rồi khi chủ nghĩa lý tưởng bị những kẻ theo đuổi lợi ích riêng chiếm đoạt thì họ trở nên thất vọng và cay đắng. Vì vậy tôi không thấy phản ứng ngược hiện nay có gì lạ
    • Tôi vẫn nghiêng khá nhiều về phía “information wants to be free”. Tôi thật sự khó hiểu những người phát hành phần mềm dưới giấy phép mã nguồn mở rồi lại nổi giận khi LLM học từ đó. Hồi Google lập chỉ mục mã nguồn thì mọi người yên ắng hơn nhiều, có lẽ vì khi đó traffic quay lại và kiếm ra tiền. Vì thế tranh cãi này với tôi có vẻ gần với chuyện ai lấy được tiền hơn là triết lý, mà tôi thì không quá quan tâm đến điều đó. Tôi cảm thấy giá trị cốt lõi của open source là để bất kỳ ai cũng có thể học hỏi, dù thông qua AI hay bằng cách khác
    • Tôi không đồng ý với lập luận cho rằng đây là sự phản bội đối với hacker ethos nguyên bản. “Information wants to be free” chỉ là một phần của hacker ethos chứ không phải toàn bộ, và còn nhiều khuynh hướng khác không liên quan tới cracking. Thêm nữa, thông tin nằm trên server không phải miễn phí như bia miễn phí, vì duy trì khả năng sẵn sàng và chi phí server là điều có thật. Việc tạo ra những cơ chế khiến các tác nhân tham lam phải chịu bất lợi vừa là quyền chính đáng của người vận hành server, vừa là một bài toán tit-for-tat thú vị. Hơn nữa, kiểu đối phó bằng đầu độc này không phải là cách kêu gọi nhà nước can thiệp mà là phản ứng trực tiếp từ cá nhân, nên ở điểm đó tôi thấy nó cũng rất hợp với tinh thần hacker. Vì vậy, dù có vô tình va chạm với một khía cạnh nào đó của tính sẵn có của thông tin, tôi vẫn nghĩ kiểu kháng cự LLM này thực ra nằm trong chính tinh thần hacker ban đầu
  • Tôi cảm thấy cách dễ nhất để làm gia tăng phản kháng với AI là cứ đưa Dario Amodei và Sam Altman lên TV rồi để họ tự nói chuyện

    • Cộng thêm cả Alex Karp vào chiến dịch quảng bá vũ khí tự hành nữa thì đúng là thành bộ ba hoàn hảo
    • Tôi muốn nghe thêm vì sao bạn lại thấy vậy. Tôi nghĩ tới những lý do như họ không kết nối được với người bình thường, động cơ khuyến khích bị lệch, nói chuyện không trực diện, và nắm quyền lực lớn hơn cả lãnh đạo dân cử. Dù vậy, về đánh giá con người thì tôi không muốn gộp Amodei với Altman lại một cục. Trong mắt tôi, Altman bóng bẩy và có năng lực, nhưng chính vì thế lại khiến người ta bất an, và có một bầu không khí thiếu đạo đức kiểu khiến người ta đi theo con người thay vì ý tưởng. Ngược lại, Amodei cho tôi cảm giác như một geek thiện chí, thuyết phục người khác bằng phẩm chất và lý tưởng. Cách anh ấy đối phó truyền thông có hơi vụng, nhưng vì thế lại trông giống như đang nói bằng chính con người mình nên tôi thấy ổn. Tất nhiên, cả hai vẫn còn nhiều điểm đáng phê phán. Dario dường như vẫn chưa đi đủ xa trong cách nhìn về rủi ro tương lai của AI, còn Altman thì để lại ấn tượng ban đầu là thông minh, giỏi giang nhưng có tính thao túng. Dẫu vậy, tôi vẫn cho rằng Dario là một trong những lãnh đạo doanh nghiệp coi vấn đề alignment nghiêm túc nhất. Anh ấy tự bỏ vốn, hiểu công nghệ, và trông giống người thật sự hiểu bản chất của nghiên cứu đang diễn ra. Chỉ cần nghĩ xem hiếm đến mức nào chuyện CEO của một công ty lại có đủ năng lực để trực tiếp làm công việc cốt lõi của người trong nghề, thì điểm này quả thật khá đặc biệt
  • Tôi xem AI như một công cụ doanh nghiệp để vắt nhân viên làm được nhiều việc hơn. Đồng thời nó cũng giống một thiết bị gieo vào đầu nhân viên ảo giác rằng mình đã trở thành một turbo-charged dev. Tôi thấy ngành tech dạo này giống một gánh xiếc nơi tiền đổ vào hơn là một nỗ lực nghiêm túc nhằm cải thiện nhân loại

    • Tôi có cảm giác ít nhất trong giới lập trình viên còn tỉnh táo thì chẳng mấy ai tin vào huyền thoại “turbo-charged dev” đó. Tôi nghĩ phần lớn đều nhìn quá rõ rằng màn kịch này rốt cuộc chỉ là một cách kiếm tiền
  • Tôi cảm thấy phong trào đầu độc kiểu này gần với slacktivism hơn. Tôi phần nào hiểu phân tích cho rằng đây là cấu trúc trong đó công việc của giai cấp lao động bị thay thế bằng compute, mà compute lại là tư bản thuần túy, nên rốt cuộc giai cấp tư bản siết cổ giai cấp lao động. Và tôi cũng nghĩ các nhà tư bản rất có thể thật sự muốn đi theo hướng đó. Nhưng nếu nhìn như vậy, thì chuyện đầu độc mô hình một chút xíu rõ ràng là quá thiếu để đối diện trực diện với những gì đang diễn ra

  • Tôi thấy xu hướng này đặc biệt rõ trên Reddit. Có những cộng đồng rất thân AI, đến mức gắn cả bình luận tóm tắt bằng AI và khuyến khích bài viết do AI viết, trong khi những subreddit khác lại chuyển sang hướng thận trọng hoặc chống AI công khai. Các cộng đồng về ảnh thì vật lộn với chuyện tác phẩm của mình bị nghi là AI, còn cộng đồng lập trình viên thì nhìn chung thích nhưng đồng thời cũng hoài nghi. Cuối cùng thì ngay cả các subreddit truyền thống cũng đang dần tự định vị đâu đó trên phổ quan điểm về AI. Ví dụ tôi nghĩ ngay đến https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/

    • Tôi thấy đây đúng là điển hình của Reddit, và rộng hơn là của tư duy bầy đàn ở con người. Mọi người có xu hướng muốn nhanh chóng đứng vào một vị trí nào đó trên một trục một chiều, hoặc bị xếp vào một trong hai phe, thay vì xử lý những sắc thái tinh tế hơn
  • Tôi hy vọng một ngày nào đó chúng ta có thể có những cuộc trò chuyện tinh tế hơn về AI và vai trò mà nó nên đảm nhiệm trong thế giới. Hiện giờ bầu không khí gần như chỉ còn những cực đoan đối lập. Tôi muốn có các thảo luận thực tế hơn về việc sử dụng có trách nhiệm, các vùng đệm xã hội, và những vấn đề như tiêu thụ năng lượng, ở đâu đó giữa hai thái cực là loại bỏ AI hoàn toàn khỏi thế giới và giao phó mọi thứ cho nó

    • Tôi cho rằng vì Venture capital đang đặt cược vào kịch bản AI thâu tóm thế giới, nên những cách sử dụng LLM mang tính bảo thủ và giới hạn sẽ còn khó được rót vốn trong một thời gian. Cũng có một lý do tinh vi hơn là việc bỏ tiền vào những use case thận trọng như vậy tự nó đã phát tín hiệu làm giảm giá trị của các khoản đầu tư cốt lõi hiện có
    • Tôi nhìn chung đứng đúng ở khoảng giữa đó. Tôi cho rằng AI crawler và các công ty đứng sau chúng phải tôn trọng robots.txt, và không được mở rộng vô hạn tới mức gây hại cho môi trường và chuỗi cung ứng. Đồng thời tôi vẫn thấy rõ là có giá trị trong việc dùng mô hình một cách thận trọng. Ví dụ, khi lần theo một vấn đề kỳ quặc trên server Linux, không phải lúc nào người ta cũng muốn đổ vào đó thật nhiều thời gian và sức lực tinh thần. Vì vậy tôi muốn dùng AI một cách có ý thức, chỉ khi thực sự cần, và tôi cực ghét chiến lược của Microsoft trong việc liên tục nhồi Copilot vào mặt người dùng. Tôi không muốn bị nhắc nhở ở mọi khoảnh khắc rằng phải tăng hiệu suất lên; tôi chỉ muốn dùng nó khi chính tôi thấy phù hợp
    • Tôi thấy đây không phải là kiểu ứng dụng mà ngày xưa mình hình dung khi nghĩ về AI. Hồi đó là những tầm nhìn lớn lao về việc giải quyết các vấn đề lớn. Vì vậy giờ tôi nghĩ nên thúc đẩy việc triển khai AI có trách nhiệm. Hãy bắt đầu ở các lĩnh vực ít rủi ro hơn, rồi chỉ nâng lên những khu vực quan trọng hơn sau khi đã kiểm chứng rằng nó hoạt động đủ tốt trong những tình huống ít thảm họa hơn
    • Tôi hơi bất ngờ khi nghe ý kiến này từ một người tham gia site này. Trái lại, tôi vẫn thấy chính ở đây vùng trung gian ấy xuất hiện thường xuyên nhất. Chỉ trong khoảng một năm qua thôi, tôi có cảm giác bầu không khí đã dịch chuyển khá nhiều: từ kiểu khoa tay mơ hồ sang chấp nhận AI nhưng đồng thời nhận diện vấn đề và nghĩ cách đối phó. Tôi xem AI là một công cụ tuyệt vời nếu được dùng đúng cách, nhưng cách hiện nay là cứ nhét bừa nó vào tay mọi người dù họ còn chưa hiểu công cụ đó, thì rất đáng sợ. Tôi đoán trong cộng đồng này cũng không ít người có cảm giác tương tự
  • Tôi thấy cả cơn giận của bài blog gốc lẫn thái độ thật lòng tin rằng những nỗ lực đầu độc như thế sẽ không thể gây ảnh hưởng xấu nào dù chỉ một chút tới việc huấn luyện mô hình, đều có phần quá đà; và thái độ thứ hai còn khiến tôi buồn vì trông như thiếu hiểu biết kỹ thuật

    • Tôi không nghĩ có thể tự tin khẳng định rằng đầu độc chắc chắn không bao giờ hiệu quả. Ít nhất nhìn vào các trường hợp liên quan, tôi có cảm giác không nên đóng hẳn cánh cửa khả năng đó; ví dụ tôi nghĩ tới https://www.reddit.com/r/BrandNewSentence/comments/1so9wf1/comment/ogrqpxz/
    • Tôi khó đồng ý với thái độ xem chính cơn giận là thứ cringe. Nếu coi toàn bộ sự phẫn nộ là trẻ con và lố bịch, người ta có thể trượt rất xa khỏi cảm nhận hiện thực và cảm thức đạo đức
    • Ngược lại, tôi còn thấy chuyện để ChatGPT viết hộ tin nhắn, email, CV; để lập trình viên phần mềm chuyên nghiệp dùng vibe coding làm cả ứng dụng; hay rêu rao rằng AGI sắp chui ra từ LLM mới là cringe hơn
  • Tôi vừa muốn buông câu đùa “Resistance is futile”, vừa khá đồng cảm với nhận định rằng AI đang thật sự phá hỏng các cộng đồng. Chẳng hạn YouTube thậm chí còn giao cả việc xử lý báo cáo cho AI, khiến các tác nhân xấu có thể nhận bừa video gốc của người khác là của mình rồi dùng demonetize để cướp doanh thu. Những YouTuber nổi tiếng như Davie504 cũng từng gặp chuyện như vậy, và ngay cả khâu kháng nghị cũng lại do robot xử lý nên rất bế tắc

    • Tôi cho rằng kiểu vấn đề này của YouTube đã tồn tại từ rất lâu trước cả LLM. Hệ thống copyright strike vốn đã hỏng từ trước rồi. Vì thế việc chọn đại một vấn đề công nghệ nào đó rồi quy hết cho AI nghe có phần không chính xác
 
amebahead 2026-04-23

Ngoài cách làm ô nhiễm dữ liệu mà AI dùng để học, còn có cách phản kháng nào khác không?
Chẳng hạn như không tiêu thụ content do AI tạo ra...

 
dongho42 2026-04-23

Tôi cũng đã nghĩ khi đọc bài này rằng liệu vô tình nó có trở thành một kiểu poisoning đối với con người hay không.

 
geesecross 2026-04-22

Không rõ vấn đề phát sinh ở đâu, nhưng sau , , , lại đang bị gắn thêm không phù hợp. Liệu đây cũng là poisoning chăng ;)

 
xguru 2026-04-22

Không rõ là mô hình đã thay đổi nhẹ hay sao, nhưng cùng một prompt lại bị hoạt động sai. Tôi đã sửa phần này.