10 điểm bởi GN⁺ 2024-10-28 | 2 bình luận | Chia sẻ qua WhatsApp
  • Mark Zuckerberg, CEO của Facebook, tuyên bố rằng mô hình ngôn ngữ lớn Llama 3 của Meta là mã nguồn mở, nhưng trên thực tế không phải vậy
  • Theo Định nghĩa Mã nguồn Mở của Open Source Initiative (OSI), giấy phép của Llama 3 không đáp ứng các điều kiện mã nguồn mở ở nhiều khía cạnh
  • Meta không phải là công ty duy nhất dùng kiểu đánh tráo này. Điều này được gọi là "open-washing"
    • Open-washing là thực hành đánh lừa khi tô vẽ một sản phẩm hoặc dịch vụ thực chất không mở như thể nó là "mở"
    • Năm 2009, nhà nghiên cứu chính sách Internet Michelle Thorne đã tạo ra thuật ngữ này, lấy cảm hứng từ "greenwashing"
  • Trong lĩnh vực AI, open-washing đang lan tràn. Trong số 45 mô hình được nhóm nghiên cứu tại Radboud University khảo sát, các mô hình của những tập đoàn lớn như Google, Meta và Microsoft thực chất không phải mã nguồn mở

Vì sao các công ty làm open-washing

  • Trước đây các công ty từng e dè mã nguồn mở, nhưng giờ nhận thức về mã nguồn mở đã chuyển sang tích cực
    • Năm 2001, Steve Ballmer tuyên bố "Linux là ung thư", cho rằng nếu dùng phần mềm mã nguồn mở thì toàn bộ phần mềm còn lại cũng phải biến thành mã nguồn mở
  • Các công ty tận dụng hình ảnh tích cực của mã nguồn mở nhưng trên thực tế lại không cam kết với mã nguồn mở
    • Điều này giúp cải thiện hình ảnh trước công chúng và thu hút người tiêu dùng coi trọng tính minh bạch và cởi mở
    • Một số công ty dùng open-washing để bảo vệ mô hình và cách làm của họ khỏi sự giám sát về mặt khoa học và quản lý, trong khi vẫn hưởng lợi từ nhãn "mở"
    • Đạo luật AI của EU dành miễn trừ đặc biệt cho các mô hình "mã nguồn mở", vì vậy đây là động lực rất mạnh cho open-washing

Thiếu một định nghĩa rõ ràng về AI mã nguồn mở

  • EU vẫn chưa thể đưa ra một định nghĩa rõ ràng về AI mã nguồn mở, và thực tế là đến nay chưa ai làm được điều đó
    • OSI dự kiến sẽ công bố định nghĩa về AI mã nguồn mở trong vài ngày tới
    • Các giấy phép open-washing hiện nay đều không phù hợp với định nghĩa của bất kỳ ai, ngoại trừ chính những người tạo ra chúng
  • Tuy vậy, không phải mọi công ty AI lớn đều nói sai về mã nguồn mở
    • Ví dụ, LLM Granite 3.0 của IBM thực sự được phát hành dưới giấy phép Apache 2 như một dự án mã nguồn mở
  • Dù OSI không phải là chính phủ hay cơ quan quản lý, vì sao việc dùng đúng thuật ngữ mã nguồn mở lại quan trọng?
    • OSI chỉ là một tổ chức phi lợi nhuận đã xây dựng các hướng dẫn hữu ích
  • Dan Lorenc, CEO của Chainguard, gần đây đã phát biểu như sau trong bài keynote tại hội nghị SOSS ở Atlanta
    • Không ai có thể ép buộc người khác phải dùng định nghĩa của OSI, nhưng rất nhiều người, đặc biệt là các luật sư, tin cậy định nghĩa này
    • Họ tin vào công việc của OSI và hiểu sự bảo vệ mà các công ty nhận được khi dùng giấy phép đáp ứng tiêu chuẩn mã nguồn mở
    • Đó là lý do định nghĩa này xuất hiện trong các hợp đồng mua sắm của những doanh nghiệp lớn trên khắp thế giới

Mã nguồn mở không chỉ là vấn đề pháp lý hay kinh doanh

  • Mã nguồn mở mang lại cho các nhà phát triển một cách làm việc tự do
    • Nếu không có mã nguồn mở, chúng ta sẽ mất đi lợi ích là có thể tự do dùng mã mà không cần biết hoặc bận tâm đến đủ loại điều khoản giấy phép
    • Nếu phải kiểm tra giấy phép của từng đoạn mã, các nhà phát triển sẽ phải xin rà soát pháp lý mỗi khi muốn dùng một thư viện mới
    • Các công ty sẽ sợ đăng bất cứ thứ gì lên Internet nếu trách nhiệm pháp lý khi công khai mã nguồn vẫn còn mơ hồ
  • Lorenc nhấn mạnh rằng đây không phải vấn đề chỉ của các tập đoàn lớn mà là vấn đề chung
    • Bất kỳ ai dùng mã nguồn mở đều sẽ bị ảnh hưởng
    • Cả dự án có thể ngừng hoạt động, lỗi bảo mật sẽ không được sửa và việc bảo trì sẽ trở nên khó khăn hơn nhiều
    • Chúng ta phải cùng hành động để bảo vệ và gìn giữ định nghĩa của mã nguồn mở. Nếu không, các luật sư sẽ lại can thiệp
  • Nhiều luật sư sở hữu trí tuệ cũng không muốn những rắc rối kiểu này
    • Giấy phép mã nguồn mở đúng nghĩa giúp cuộc sống của doanh nghiệp, lập trình viên và luật sư đều dễ dàng hơn
    • Việc đưa vào các điều khoản như "mở, trừ những người có thể cạnh tranh với chúng tôi" hoặc "mở, trừ những người có thể triển khai mã trên đám mây" chỉ là tự chuốc lấy rắc rối

Open-washing gây hại cho tất cả mọi người

  • Cuối cùng, open-washing sẽ làm vấy bẩn công việc pháp lý, kinh doanh và phát triển của tất cả mọi người
  • Trớ trêu thay, ngay cả những công ty thiển cận hiện đang ủng hộ cách tiếp cận này cũng sẽ bị tổn hại
  • Bởi vì gần như toàn bộ công việc của họ, đặc biệt là trong lĩnh vực AI, cuối cùng vẫn dựa trên mã nguồn mở

Ý kiến của GN⁺

  • Thực hành open-washing làm xói mòn định nghĩa mã nguồn mở có thể gây tác động tiêu cực không chỉ với lĩnh vực AI mà còn với toàn bộ ngành phần mềm. Nó hạn chế hoạt động của nhà phát triển và làm tăng rủi ro pháp lý cho doanh nghiệp
  • Việc các công ty chỉ muốn tận dụng hình ảnh tích cực của mã nguồn mở là một thái độ thiển cận. Về dài hạn, điều đó thậm chí có thể gây hại cho chính họ
  • Để công nghệ AI phát triển, hợp tác và chia sẻ theo tinh thần mã nguồn mở là điều thiết yếu. Các công ty cần đi đầu trong việc xây dựng một văn hóa mã nguồn mở thực sự
  • Nhu cầu cấp bách hiện nay là thiết lập một định nghĩa và bộ tiêu chuẩn rõ ràng cho AI mã nguồn mở. OSI dự kiến sớm công bố định nghĩa AI mã nguồn mở, và từ đó doanh nghiệp, chính phủ cùng cộng đồng nhà phát triển cần phối hợp với nhau
  • Cũng cần có các hoạt động nâng cao nhận thức cho người tiêu dùng và nhà phát triển để ngăn ngừa open-washing. Điều quan trọng là không chấp nhận nguyên xi các tuyên bố "mở" của doanh nghiệp mà phải xem kỹ giấy phép và cách làm thực tế

2 bình luận

 
ndrgrd 2024-10-28

Hiện tượng công khai dự án dưới dạng mã nguồn mở để giao cho cộng đồng sửa lỗi ban đầu và cải thiện tính năng, rồi khi đã ổn định thì lại lặng lẽ rút về giấy phép độc quyền, dường như đang xuất hiện khá thường xuyên.

Cũng có ý kiến cho rằng cứ fork là được, nhưng rốt cuộc doanh nghiệp vẫn cứ thế nuốt trọn hình ảnh và giá trị tên tuổi đã được gây dựng.

 
GN⁺ 2024-10-28
Ý kiến Hacker News
  • Khi lựa chọn giữa hai chương trình hoặc mô hình AI, thường nảy sinh tranh luận giữa những người ưu tiên mã nguồn mở và những người không như vậy. Mục tiêu là làm cho cả những chương trình không phải mã nguồn mở cũng trông giống như mã nguồn mở.

  • Mã nguồn mở là một sự thỏa hiệp thân thiện với doanh nghiệp, nhưng một số người tham gia vẫn có tiêu chuẩn đạo đức cao. Những người mang tinh thần đó cần ngăn chặn việc lạm dụng mã nguồn mở.

  • Nếu không thể giải quyết bằng thương hiệu, chứng nhận hoặc giấy phép, thì cần truyền tải thông điệp qua truyền thông đại chúng. <i>The Register</i> có hiểu biết nội bộ, nhưng vấn đề này cần được nhiều người biết đến hơn.

  • Nhiều công ty vừa chỉ trích mã nguồn mở, vừa vận hành hoạt động kinh doanh dựa vào phần mềm mã nguồn mở như Linux, Java và Debian. Phần lớn doanh nghiệp không cảm thấy có nghĩa vụ phải đóng góp hay hỗ trợ.

  • OSI đang chuẩn bị một định nghĩa mã nguồn mở cho AI còn gây nhiều tranh cãi.

  • thirdweb về mặt kỹ thuật là mã nguồn mở, nhưng không thể hoạt động nếu không có API key, đồng thời còn kiểm tra hạn mức gọi API trên SaaS. Điều này làm nản lòng các nhóm muốn xây dựng một giải pháp thay thế mã nguồn mở thực sự.

  • Việc không thể phổ biến các khái niệm như fair source đã dẫn đến tình trạng các công ty nhỏ không theo mô hình SaaS khó có thể sống sót với mã nguồn mở.

  • Mã nguồn mở không mang đạo đức hay triết lý như phần mềm tự do. Phần mềm tự do vượt trội hơn mã nguồn mở.

  • Với các mô hình lớn, chi phí huấn luyện cao và các binary artifact vừa có giá trị vừa có thể bị chỉnh sửa. Nếu OSI thiết lập được một định nghĩa, thì dù Meta có tuân theo hay không, nỗ lực đó vẫn đáng được ghi nhận.

  • OSI cần nhận thức rằng trong thời đại các nhà cung cấp cloud quy mô lớn, cần có sự bảo vệ khỏi các tác nhân trên thị trường. Cần có những lựa chọn giấy phép rõ ràng để tránh những màn kịch như Mongo, Elastic và Redis.

  • Thuật ngữ "Open <something>" cần được bảo vệ để không gây hiểu lầm cho công chúng. Cần tránh những sự nhập nhằng như "OpenAI".

  • So với việc dùng sai thuật ngữ "Open Source", hành vi tiếp nhận đóng góp từ cộng đồng rồi sau đó rút lại giấy phép còn tệ hơn. Điều đó nên bị coi là gian dối và phải chịu trách nhiệm dân sự.

  • Với mô hình AI, nếu không chia sẻ script huấn luyện và dữ liệu có thể tái lập, thì tên gọi phù hợp hơn sẽ là "Open Weights".