5 điểm bởi GN⁺ 2024-05-10 | 1 bình luận | Chia sẻ qua WhatsApp

Phản ứng của người dùng trước thông báo hợp tác giữa Stack Overflow và OpenAI

  • Một số người dùng đang phản đối sau khi Stack Overflow và OpenAI gần đây công bố quan hệ đối tác
  • Một số người dùng đã cố xóa nội dung của mình (câu hỏi và câu trả lời) khỏi Stack Overflow, nhưng gặp khó khăn vì trang web không cho phép xóa dễ dàng
  • Vì vậy, những người dùng này đã quyết định chỉnh sửa để "phá hoại" câu hỏi hoặc câu trả lời của mình nhằm phản đối sự hợp tác giữa Stack Overflow và OpenAI

Tổng quan về quan hệ đối tác giữa Stack Overflow và OpenAI

  • Stack Overflow và OpenAI sẽ hợp tác thông qua một quan hệ đối tác API mới
  • Mục tiêu của sự hợp tác này là kết hợp nền tảng tri thức khổng lồ của Stack Overflow với các mô hình AI tiên tiến của OpenAI để cung cấp cho các nhà phát triển
  • Người dùng OpenAI sẽ có thể tận dụng dữ liệu chính xác và đã được kiểm chứng của Stack Overflow thông qua quyền truy cập OverflowAPI để giải quyết vấn đề nhanh hơn và tập trung vào các công việc ưu tiên
  • Ngoài ra, OpenAI dự kiến sẽ tích hợp tri thức kỹ thuật đã được kiểm chứng của Stack Overflow vào ChatGPT để cải thiện khả năng truy cập của người dùng tới thông tin và mã đáng tin cậy

Sự phản đối đối với AI

  • Các trang web Stack Exchange, bao gồm Stack Overflow, là những công cụ rất hữu ích cho cộng đồng, nhưng một số người dùng không mấy hài lòng khi nội dung của họ bị dùng để huấn luyện AI và tạo ra câu trả lời mà không ghi nguồn
  • Đây là phản ứng thường thấy hiện nay không chỉ trên Stack Overflow mà trên toàn bộ Internet từ phía những người tạo nội dung
  • Internet hiện đang trải qua một giai đoạn thay đổi: lưu lượng truy cập blog và lượt xem trang giảm, việc tìm kiếm câu trả lời bằng AI tăng lên, và một số người còn giảm sử dụng công cụ tìm kiếm
  • Đây là thời kỳ căng thẳng, nơi sự thích nghi với các khả năng mới của ChatGPT và các LLM (mô hình ngôn ngữ lớn) khác cùng tồn tại với sự bất định về ý nghĩa của tất cả những điều này đối với Internet như chúng ta biết
  • Phản ứng gần đây đối với quan hệ đối tác giữa Stack Overflow và OpenAI chỉ là một ví dụ cho việc nhiều người phản ứng tiêu cực trước làn sóng phổ cập AI quy mô lớn và những thay đổi nhanh chóng mà nó kéo theo

Stack Overflow có đang khóa tài khoản vì xóa nội dung không?

  • Nhiều người dùng đã đăng trên Twitter và Hacker News rằng sau khi cố xóa nhiều câu hỏi và câu trả lời từng đăng trên Stack Overflow, họ nhận được email từ điều phối viên Stack Overflow thông báo tài khoản bị tạm giữ hoặc tạm khóa trong 7 ngày
  • Theo email từ nhóm điều phối Stack Overflow, việc xóa hoặc loại bỏ nội dung có thể hữu ích cho người khác có thể gây gián đoạn cho toàn bộ cộng đồng, ngay cả khi nội dung đó không còn hữu ích với chính tác giả
  • Do hoạt động kinh doanh của Stack Overflow và toàn bộ mạng Stack Exchange phụ thuộc vào nội dung do người dùng tạo ra để duy trì tính hữu ích của trang web, rõ ràng có lý do kinh doanh khiến họ không muốn người dùng xóa nội dung hàng loạt
  • Việc Stack Overflow đình chỉ tài khoản và gửi email cảnh báo có lẽ không phải điều mới. Có thể họ đã áp dụng các chính sách này từ lâu để bảo vệ nền tảng
  • Nếu người dùng có thể dễ dàng phá hoại hoặc xóa một lượng lớn nội dung, điều đó có thể gây ra sự hỗn loạn đáng kể cho nền tảng, vì vậy việc bảo vệ nội dung là lợi ích tốt nhất của cả Stack Overflow lẫn cộng đồng
  • Ngoài ra, nhiều khả năng đây là email tự động được kích hoạt bởi hành vi của người dùng, và việc liên hệ trực tiếp với Stack Overflow về nội dung có thể là một bước đi hợp lý
  • Cho đến nay vẫn chưa thấy phản hồi từ Stack Overflow về các vụ đình chỉ tài khoản này. Cũng chưa rõ thực tế có bao nhiêu người dùng đang thử làm vậy, nên có thể không hề tồn tại làn sóng phản đối lớn đối với quan hệ đối tác giữa Stack Overflow và OpenAI
  • Đà tiến của việc áp dụng AI sẽ khó chậm lại trong thời gian tới, nên sẽ rất đáng chú ý để theo dõi mọi chuyện sẽ diễn biến ra sao
  • Những người dùng Stack Overflow còn lại không được khuyến khích xóa nội dung của mình như một hình thức phản đối

Ý kiến của GN⁺

  • Quan hệ đối tác giữa Stack Overflow và OpenAI có vẻ sẽ tạo ảnh hưởng lớn đến sự phát triển của công nghệ AI và cộng đồng nhà phát triển. Tuy nhiên, cách cân bằng giữa việc bảo vệ quyền sở hữu trí tuệ của từng lập trình viên và việc sử dụng nội dung đó làm dữ liệu huấn luyện AI vẫn là bài toán cần giải quyết
  • Các nhà phát triển cần có thể chia sẻ kiến thức của mình mà vẫn nhận được sự đền đáp xứng đáng. Stack Overflow có vẻ cần xây dựng một cơ chế bồi đáp phù hợp cho việc này
  • Để khuyến khích các nhà phát triển tự nguyện chia sẻ tri thức, niềm tin vào cộng đồng là yếu tố rất quan trọng. Cần một cách tiếp cận thận trọng để sự việc lần này không làm xói mòn niềm tin của các nhà phát triển vào Stack Overflow
  • Mặt khác, việc nâng cao năng suất phát triển nhờ tận dụng các công nghệ AI như ChatGPT cũng là lợi ích lớn đối với các nhà phát triển. Cần tiếp tục tìm kiếm cách vừa giảm thiểu tác dụng phụ như bảo vệ quyền riêng tư, vừa tối đa hóa lợi ích của việc ứng dụng AI
  • Một vấn đề tương tự từng là tranh cãi bản quyền xoay quanh GitHub Copilot. Có lẽ cần những nỗ lực thảo luận sôi nổi trong cộng đồng nhà phát triển để tìm ra một điểm đồng thuận mà mọi bên đều có thể chấp nhận

1 bình luận

 
GN⁺ 2024-05-10
Ý kiến trên Hacker News
  • Vấn đề thay đổi giấy phép nội dung do người dùng tạo của StackOverflow:
    • Khoảng 5 năm trước, StackOverflow đã tuyên bố sai rằng mọi nội dung do người dùng gửi lên đều được cung cấp theo CC-BY-SA 4.0. Thỏa thuận gốc với người dùng thực ra là CC-BY-SA 3.0.
    • Từ giữa năm 2018 đến đầu năm 2019, đã có sự nhầm lẫn về giấy phép áp dụng cho mã và nội dung không phải mã.
    • Đầu năm 2019, họ yêu cầu người dùng đăng nhập lại và chấp nhận thỏa thuận giấy phép mới.
    • Hiện tại, nội dung trước ngày 5 tháng 5 năm 2018 áp dụng CC-BY-SA 3.0, còn sau đó áp dụng CC-BY-SA 4.0.
  • Ý kiến của người dùng về vấn đề scraper AI và việc cung cấp dữ liệu cho OpenAI của StackOverflow:
    • Có người dùng không thấy phiền khi câu trả lời của mình được dùng để huấn luyện AI. Họ cho rằng điều đó mang lại giá trị lớn cho các công cụ như ChatGPT.
    • Thỏa thuận hợp tác với OpenAI không phải là cốt lõi của vấn đề xóa nội dung của người dùng. Về mặt giấy phép, việc xóa nội dung vốn không được hoan nghênh và thường bị đảo ngược.
    • Do giấy phép CC-BY-SA, ngay cả khi StackOverflow không cho phép thì người khác vẫn có thể sao chép, nên rất khó xóa nội dung.
    • Người dùng có thể xóa tên hoặc chỉnh sửa thông tin cá nhân, nhưng không thể gỡ bỏ về sau chính phần nội dung chất lượng mà họ đã đóng góp.
  • Vấn đề khi một công ty vì lợi nhuận quản lý một sản phẩm "miễn phí":
    • Vì phải tạo ra doanh thu nên họ không bị ràng buộc bởi đạo đức nguồn mở. Người dùng tưởng rằng mình đang đóng góp cho nguồn mở, nhưng thực tế không phải vậy.
    • Hành vi của StackExchange có lẽ là hợp pháp, nhưng người đóng góp không phải là bên có lợi ích gắn bó, và chỉ cần giữ lại số lượng người đóng góp đủ để duy trì tính bền vững về mặt thương mại là được.
    • Với các sản phẩm được cung cấp miễn phí, người dùng rồi sẽ trở thành sản phẩm; nếu không biết chúng được kiếm tiền như thế nào, sớm muộn gì bạn cũng sẽ thất vọng.
  • Sự cần thiết của một loại giấy phép nội dung mới chuyên cho huấn luyện AI:
    • Có thể sẽ xuất hiện một loại giấy phép theo tinh thần của GPL, chẳng hạn yêu cầu công khai trọng số AI nếu nội dung được dùng để huấn luyện AI thương mại.
  • Mô hình bán bộ dữ liệu của StackOverflow:
    • Ngay từ đầu, StackOverflow đã tập trung vào việc xây dựng bộ dữ liệu phục vụ SEO hơn là lấy người dùng làm trung tâm. Thỏa thuận với OpenAI không làm thay đổi nhiều điều.
    • Với sự xuất hiện của LLM, khủng hoảng của StackOverflow gần như là điều không thể tránh khỏi, nên tốt hơn là bán cho OpenAI để thu được những gì có thể trước khi sụp đổ.
  • Tầm quan trọng của điều khoản ShareAlike trong giấy phép CC BY-SA:
    • Điều khoản yêu cầu nếu tạo tác phẩm phái sinh thì phải phân phối theo cùng giấy phép là một điều khoản rất rộng và mơ hồ. Định nghĩa của "build upon" có thể không hấp dẫn với nhiều người dùng.
  • So sánh ưu và nhược điểm của LLM và StackOverflow:
    • Nhờ có LLM, giờ đây người ta có thể tránh StackOverflow nhiều nhất có thể. StackOverflow bị cho là đầy tính tinh hoa và sự độc hại coi trọng quy trình hơn là giúp đỡ thực chất.
    • Có phàn nàn rằng LLM đôi khi đưa ra câu trả lời sai, nhưng trong các câu trả lời trên StackOverflow cũng có nhiều cái hoàn toàn sai hoặc không liên quan đến câu hỏi. Cũng có rất nhiều câu trả lời đã lỗi thời.
    • Nếu khả năng diễn đạt của LLM được kết hợp với sự kiểm chứng của người dùng StackOverflow thì đó sẽ là phương án lý tưởng nhất. Điều này có thể không tốt cho những người chỉ muốn kiếm điểm internet, nhưng sẽ là tốt nhất cho người dùng.
  • Thông báo cảnh báo tự động của StackOverflow về việc xóa nội dung hàng loạt:
    • Có vẻ ít nhất đã tồn tại từ năm 2017, và dường như được hiển thị tự động khi phát hiện xóa hàng loạt.
    • Vì StackOverflow có phần giống một wiki hơn là một diễn đàn, nên có thể hiểu được lý do của chính sách này. Có lẽ nó không phải được đưa vào để dập tắt các cuộc phản đối OpenAI.
  • Cũng có ý kiến cho rằng cá nhân họ hầu như không còn sử dụng StackOverflow trong 2 năm qua.