Mô hình Phi-2 của Microsoft chuyển sang giấy phép MIT

(huggingface.co)

2 điểm bởi GN⁺ 2024-01-08 | 1 bình luận | Chia sẻ qua WhatsApp

Trong commit 7e10f3e của kho Hugging Face cho Phi-2, 3 tệp LICENSE, NOTICE.md và README.md đã được thay đổi, chuyển thông tin giấy phép sang MIT
LICENSE mới được thay thế bằng toàn văn MIT License, cho phép rộng rãi việc sử dụng, sao chép, chỉnh sửa, phân phối, cấp lại giấy phép và bán
Nhiều điều khoản trong Microsoft Research License trước đây đã bị xóa, gồm cấm reverse engineering, hạn chế lưu trữ độc lập, xử lý thông tin cá nhân, trọng tài, giới hạn bồi thường thiệt hại, v.v.
Metadata trong README dùng license: mit thay cho license_name: microsoft-research-license, trong khi liên kết LICENSE hiện có vẫn được giữ nguyên
NOTICE.md mới thông báo flash-attention là thành phần bên thứ ba, đồng thời bao gồm BSD 3-Clause License và nội dung cho phép reverse engineering ở phạm vi hạn chế nhằm mục đích gỡ lỗi các thay đổi đối với thư viện LGPL

Các tệp thay đổi trong commit

Commit của kho microsoft/phi-2 trên Hugging Face được hiển thị là “Upload 3 files”, với 3 tệp được thay đổi là LICENSE, NOTICE.md và README.md
Có thể xem danh sách tệp ở trạng thái commit đó tại Browse files

LICENSE: thay Microsoft Research License bằng MIT License

Tệp LICENSE đã xóa nội dung giấy phép cũ và được thay bằng toàn văn MIT License
LICENSE mới bao gồm MIT License sau các dòng PhyAGI. và Copyright (c) Microsoft Corporation.
MIT License cho phép miễn phí các quyền sau cho bất kỳ ai nhận được phần mềm và các tệp tài liệu liên quan
- sử dụng, sao chép, chỉnh sửa, hợp nhất
- công bố, phân phối, cấp lại giấy phép
- bán bản sao của phần mềm
- cấp các quyền tương tự cho người được cung cấp phần mềm
Điều kiện là phải bao gồm thông báo bản quyền và thông báo cho phép trong tất cả bản sao hoặc phần đáng kể của phần mềm
Tuyên bố miễn trừ bảo đảm được đưa vào dưới dạng AS IS, không cung cấp bất kỳ bảo đảm rõ ràng hay ngụ ý nào, bao gồm bảo đảm về khả năng thương mại, phù hợp cho một mục đích cụ thể và không xâm phạm
Chủ sở hữu bản quyền và chủ thể quyền không chịu trách nhiệm đối với các khiếu nại, thiệt hại hoặc trách nhiệm phát sinh từ việc sử dụng phần mềm hoặc các giao dịch khác

Các điều khoản hạn chế cũ đã bị xóa

Nhiều hạn chế và điều khoản pháp lý trong LICENSE cũ đã bị xóa
Các điều khoản bị xóa bao gồm những nội dung sau
- cấm reverse engineering, dịch ngược và tháo dịch mã tài liệu
- cấm xóa, thu nhỏ, chặn hoặc chỉnh sửa thông báo của Microsoft hoặc nhà cung cấp
- cấm sử dụng theo cách trái pháp luật hoặc nhằm tạo, phát tán mã độc
- cấm chia sẻ, công bố, phân phối, cho thuê tài liệu, cung cấp giải pháp lưu trữ độc lập, chuyển giao cho bên thứ ba
Các hạn chế liên quan đến thông tin cá nhân cũng bị bỏ
- dữ liệu có thể nhận dạng cá nhân không được sử dụng ngoài mục đích đã được phê duyệt hoặc đồng ý
- không được sử dụng để liên hệ với cá nhân
- phải hủy thông tin cá nhân cùng bản sao lưu và bản sao ngay khi hoàn tất nghiên cứu
Điều khoản rằng khi cung cấp bản sửa đổi cho Microsoft thì sẽ cấp cho Microsoft một giấy phép rộng rãi cũng đã bị xóa
Ngoài ra, các điều khoản về công bố, phản hồi, hạn chế xuất khẩu, dịch vụ hỗ trợ, trọng tài tại Mỹ và từ bỏ kiện tập thể, luật áp dụng, quyền người tiêu dùng, miễn trừ bảo đảm và giới hạn bồi thường thiệt hại cũng đã bị xóa

Thay đổi metadata trong README

Thông tin giấy phép trong front matter của README.md đã thay đổi
Các mục bị xóa như sau
- license:
- license_name: microsoft-research-license
Mục mới là license: mit
license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSE được giữ nguyên
Các mục inference: false và language: - en được giữ nguyên trong diff được hiển thị

NOTICE.md và thông báo thành phần bên thứ ba

Tệp NOTICE.md mới bắt đầu bằng các cụm từ “NOTICES AND INFORMATION” và “Do Not Translate or Localize”
Microsoft cho biết phần mềm này bao gồm tài liệu của bên thứ ba
Một phần mã nguồn mở của Microsoft được cung cấp tại https://3rdpartysource.microsoft.com, hoặc có thể yêu cầu bằng cách gửi séc hoặc lệnh chuyển tiền trị giá US $5.00 kèm tên sản phẩm, tên thành phần nguồn mở, nền tảng và số phiên bản
Bất kể các điều kiện khác, có thể reverse engineering phần mềm này trong phạm vi cần thiết để gỡ lỗi các thay đổi đối với thư viện được cấp phép theo GNU Lesser General Public License
Thành phần bao gồm flash-attention
Thông báo về flash-attention bao gồm BSD 3-Clause License
- Khi phân phối lại mã nguồn, phải giữ lại thông báo bản quyền, danh sách điều kiện và điều khoản miễn trừ trách nhiệm
- Khi phân phối lại ở dạng nhị phân, phải bao gồm cùng thông báo, điều kiện và điều khoản miễn trừ trách nhiệm trong tài liệu hoặc các tài liệu khác
- Không được dùng tên của chủ sở hữu bản quyền hoặc người đóng góp để quảng bá sản phẩm phái sinh nếu không có sự cho phép trước bằng văn bản
Thông báo BSD 3-Clause nêu rằng phần mềm đó cũng được cung cấp “AS IS” và không chịu trách nhiệm đối với thiệt hại trực tiếp, gián tiếp, ngẫu nhiên, đặc biệt, mang tính trừng phạt hoặc hệ quả

1 bình luận

GN⁺ 2024-01-08

Ý kiến trên Hacker News

Việc những mô hình mở như thế này xuất hiện thật sự rất hào hứng.
Điều thú vị là các “nhà đạo đức học” AI dường như muốn hành xử như một tầng lớp tăng lữ cấp cao kiểm soát quyền truy cập vào các mô hình học máy nhân danh an toàn. Nhưng tôi cho rằng rủi ro lớn nhất của AI nằm ở việc những người kiểm soát mô hình dùng chính mô hình đó để kiểm soát và kiểm duyệt những gì mọi người có thể viết.
Tôi nghĩ các mô hình mã nguồn mở trong tay công chúng mới là hàng phòng vệ tốt nhất trước những rủi ro thực sự của AI, và xin hoan nghênh Facebook, Microsoft, Mistral vì đã thúc đẩy điều đó.
- Nhìn các “nhà đạo đức học” AI theo cách đó là một diễn giải quá ác ý.
  Bạn nên đọc các lập luận thực tế thay vì các bản tóm tắt trên mạng xã hội. Cuộc thảo luận sâu hơn nhiều so với bạn nghĩ, bao quát rộng các rủi ro mà bạn lo ngại, và cũng có những giải pháp được đề xuất. Những giải pháp đó có khả năng thực sự hoạt động cao hơn so với tuyên bố đây là “hàng phòng vệ tốt nhất”.
- Tôi cho rằng việc mô tả “tất cả” các nhà đạo đức học AI như một tầng lớp tăng lữ muốn ngăn quyền truy cập vào mô hình là có hại.
  Có nhiều người coi trọng cả việc dân chủ hóa các công cụ này lẫn việc sử dụng chúng một cách an toàn và có đạo đức.
- Tôi nghĩ giờ thì con mèo đã chui ra khỏi bao rồi.
  Kỳ vọng những người có ý đồ xấu sẽ tuân thủ câu chữ trong giấy phép vốn ngay từ đầu đã không phải là một biện pháp kiểm soát tốt. Nó chỉ cản trở tiến bộ và đổi mới của những người đủ thiện chí để tuân thủ luật, còn những người ở các nơi như Nga, Bắc Triều Tiên, Trung Quốc, hay các tổ chức tội phạm và kẻ lừa đảo với ý đồ khác thì không bị ràng buộc bởi những quan niệm đó.
  Cộng đồng làm việc dưới các giấy phép mã nguồn mở đúng nghĩa đang lớn mạnh, và những điều thú vị đang diễn ra ngày càng nhanh. Các giấy phép thay thế có hiệu quả yếu, cắt đứt kết nối với cộng đồng đó, khiến việc hợp tác trở nên phức tạp, và ngày càng trở thành thiểu số trong toàn bộ nghiên cứu. Vì vậy những giấy phép như thế ngày càng trở nên vô nghĩa.
  Sửa điều này sẽ đưa mọi thứ về trạng thái đơn giản và chuẩn mực hơn về mặt pháp lý, giúp thương mại hóa, hợp tác và nghiên cứu dễ dàng hơn. Có vẻ Microsoft đang hợp lý khi thừa nhận giá trị ở đó và điều chỉnh theo thực tế.
- Ai có thể bảo đảm rằng mục đích ẩn thực sự của khoản đầu tư AI điên rồ này không phải là xây dựng hạ tầng kiểm duyệt quy mô lớn?
- Ở đâu giá trị tụ lại, ở đó sẽ sinh ra một ngành hàu bám đặt chân lên bàn đạp phanh nếu bạn không nộp thuế cho đội quân những người không đóng góp.
Trước đây là giấy phép phi thương mại nên kỳ vọng có phần giảm đi.
Xét đến hiệu năng và kích thước, việc chuyển sang một giấy phép thân thiện với thương mại là một sự kiện khá lớn.
Điểm quan trọng của mô hình này là khả năng suy luận rất tốt.
Tuy nhiên, nó cố ý không được huấn luyện trên các tập dữ liệu crawl web quy mô lớn để tránh học cách chế tạo bom hay làm “việc xấu”.
Vì vậy, so với các mô hình cùng hạng, hoặc thậm chí có nhiều tham số hơn, đây là mô hình “suy nghĩ thông minh” nhất, nhưng tương đối thiếu kiến thức về thế giới hay kiến thức lặt vặt.
Tương lai có thể thay đổi, nhưng tôi nghĩ hiện trạng là như vậy.
- Dù vậy, nó vẫn rất tuyệt cho ứng dụng RAG.
  Vì tôi muốn câu trả lời dựa trên dữ liệu tôi cung cấp, chứ không phải nội dung học được từ web.
- Nếu nhìn mô hình ngôn ngữ lớn theo hai thuộc tính là khả năng dùng ngôn ngữ tự nhiên và kiến thức để trả lời câu hỏi, thì mô hình ngôn ngữ nhỏ có thể được xem là những mô hình rất giỏi xử lý ngôn ngữ tự nhiên.
  Nhiều tác vụ không cần kiến thức phổ thông, và đặc biệt trong RAG thì ưu điểm này rất lớn.
- Tôi hy vọng trọng tâm của mô hình không phải là nhúng sẵn dữ liệu vào bên trong.
  Dữ liệu nên được cung cấp qua tìm kiếm thì tốt hơn, và nhờ đó sẽ giảm các câu trả lời “trông có vẻ thông minh nhưng hoàn toàn sai”.
  Nếu dữ liệu tích hợp sẵn ít hơn, mô hình cũng có thể dùng tổng quát hơn bên ngoài phạm vi trợ lý chat, vì nhiều khi ta muốn mô hình chỉ biết dữ liệu do người dùng cung cấp.
  Ví dụ, trong một game fantasy trung cổ, nếu nhân vật đột nhiên bắt đầu nói về chính trị Mỹ thì sẽ rất kỳ quặc. Phi-2 cũng sẽ không giải quyết hoàn toàn điều đó nếu không tinh chỉnh, nhưng ý chính là theo hướng đó.
- Tôi nghĩ việc không huấn luyện bằng dữ liệu crawl web là để Microsoft trông bớt lộ liễu hơn trong việc đánh cắp tài sản và quyền riêng tư rồi kiếm tiền từ đó.
Tôi tò mò về tập dữ liệu hơn là mô hình.
- Có lẽ đó là một phiên bản phát triển từ phương pháp huấn luyện “Textbooks are all you Need” của phi-1/1.5: https://arxiv.org/abs/2309.05463
Đây là một thay đổi tuyệt vời, và cũng cho thấy vì sao các dự án mã nguồn mở độc lập lại quan trọng.
Khó có thể nói việc TinyLlama được phát hành theo giấy phép Apache 2.0 không có tác động đến thay đổi lần này.
- Cơ sở nào khiến bạn cho rằng việc TinyLlama được phát hành đã có tác động?
Có vẻ đây là tín hiệu cho thấy Phi-3 và các mô hình thế hệ tiếp theo sẽ khiến Phi-2 trở nên lỗi thời.
Mô hình này đã ở nhóm dẫn đầu khá lâu, vậy nó tốt ở điểm nào?
- Hiệu năng của nó rất tốt so với kích thước mô hình và chi phí suy luận.
  Đây là mô hình tốt nhất có thể chạy trên các thiết bị nhỏ như điện thoại mà vẫn đạt hiệu năng gần GPT-3.5.
  Kiến trúc và dữ liệu huấn luyện cũng thú vị. Vì là mô hình thưa dùng dữ liệu tổng hợp được tuyển chọn, nó đạt độ chính xác cao hơn nhiều so với các mô hình được huấn luyện trên văn bản Internet ngẫu nhiên.

Mô hình Phi-2 của Microsoft chuyển sang giấy phép MIT

Các tệp thay đổi trong commit

LICENSE: thay Microsoft Research License bằng MIT License

Các điều khoản hạn chế cũ đã bị xóa

Thay đổi metadata trong README

NOTICE.md và thông báo thành phần bên thứ ba

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News