2 điểm bởi GN⁺ 2023-12-31 | 1 bình luận | Chia sẻ qua WhatsApp

Triển vọng ảm đạm cho AI sáng tạo

  • Các hệ thống AI sáng tạo được huấn luyện trên những tài liệu có bản quyền và có thể tạo ra nội dung có khả năng vi phạm bản quyền.
  • OpenAI không minh bạch về những tài liệu mà các hệ thống của họ đã được huấn luyện.
  • Người dùng có thể vi phạm bản quyền mà không có thông tin về nguồn gốc của hình ảnh được tạo ra.

Giới hạn của hệ thống

  • Các hệ thống như DALL-E và ChatGPT về bản chất là những "hộp đen", hiện vẫn thiếu khả năng truy vết hoặc cung cấp nguồn gốc.
  • Cho đến khi một kiến trúc mới có khả năng truy vết nguồn gốc được phát triển, vi phạm bản quyền sẽ tiếp tục xảy ra bất kể ý định của người dùng.

Rủi ro pháp lý và rủi ro tài chính

  • Vụ kiện của The New York Times chỉ là vụ đầu tiên trong số nhiều vụ kiện nhằm vào AI sáng tạo, và ngay cả khi được giải quyết, giá trị của nó được dự đoán sẽ lên tới hàng triệu đô la hoặc hơn.
  • Không chỉ OpenAI, Microsoft, công ty sử dụng Dall-E thông qua Bing, cũng đang đối mặt với rủi ro pháp lý.

Ý kiến của GN⁺

  • Sự phát triển của công nghệ AI sáng tạo đang làm gia tăng rủi ro vi phạm bản quyền, và đây là một vấn đề quan trọng gây ra căng thẳng giữa công nghệ và khuôn khổ pháp lý.
  • Việc người dùng không thể biết nguồn gốc của nội dung được tạo ra là một yếu tố then chốt thúc đẩy thảo luận về đạo đức AI và tính minh bạch.
  • Bài viết này mang đến góc nhìn sâu sắc thú vị về những tác dụng phụ khó lường mà sự phát triển nhanh chóng của công nghệ AI có thể đem lại, cũng như tác động của chúng đối với các ngành liên quan.

1 bình luận

 
GN⁺ 2023-12-31
Ý kiến trên Hacker News
  • Tóm tắt bình luận thứ nhất:

    • Một trong những lý do Disney thành công là họ đã chuyển thể những câu chuyện có sẵn như truyện dân gian được truyền lại qua nhiều thế hệ.
    • Văn hóa là tài sản của cộng đồng, và phát triển, trưởng thành thông qua kể chuyện tập thể và tái diễn giải.
    • Cuộc tranh luận hiện tại về AI và vi phạm bản quyền có xu hướng bỏ qua khía cạnh nền tảng này của sự tiến hóa văn hóa.
    • Không nên phớt lờ hệ quả pháp lý và bối cảnh lịch sử của việc kể chuyện trong văn hóa khi tìm hiểu bản chất của một xã hội sáng tạo.
  • Tóm tắt bình luận thứ hai:

    • Tại Liên minh châu Âu (EU), Điều 3 và Điều 4 của "Chỉ thị bản quyền trong thị trường số chung" đã điều chỉnh vấn đề này.
    • Tất cả mọi người, bao gồm cả các nhà phát triển machine learning (ML) thương mại, chỉ có thể sử dụng các tác phẩm có thể truy cập hợp pháp nếu chủ sở hữu bản quyền không tuyên bố rõ ràng bảo lưu việc sử dụng cho mục đích khai thác văn bản và dữ liệu.
    • Việc dùng một thứ như "robots.txt" để đánh dấu nội dung không dành cho huấn luyện đang được thảo luận, và người dùng cuối cần thận trọng với việc sử dụng nội dung được tạo ra.
  • Tóm tắt bình luận thứ ba:

    • Việc AI được huấn luyện bằng tài liệu có bản quyền có thể tạo ra đầu ra tương tự là điều đã được biết đến.
    • Các công ty lớn đã áp dụng cách này, và giờ tình hình đã đến mức không thể đảo ngược.
    • Vì công chúng nói chung không hiểu rõ cách AI được tạo ra hay các vấn đề bản quyền, câu hỏi quan trọng lúc này là 'giờ phải làm gì'.
  • Tóm tắt bình luận thứ tư:

    • Trách nhiệm bảo đảm không vi phạm bản quyền thuộc về người xuất bản tác phẩm.
    • Cho rằng ChatGPT hay các công cụ khác sẽ không tạo ra nội dung có bản quyền là một suy nghĩ ngây thơ.
  • Tóm tắt bình luận thứ năm:

    • Mục đích cốt lõi của nghệ thuật và xuất bản nên là tạo ảnh hưởng đến văn hóa và xã hội, chứ không chỉ để kiếm tiền.
    • Tác phẩm sáng tạo cần được bảo vệ, nhưng cũng nên được chuyển vào phạm vi công cộng nhanh hơn nhiều để thúc đẩy sáng tạo và truyền cảm hứng.
  • Tóm tắt bình luận thứ sáu:

    • Việc giải quyết vấn đề này có vẻ không quá khó.
    • Những cách diễn đạt như "thợ sửa ống nước trong trò chơi điện tử" là dạng viết tắt chỉ một thực thể cụ thể, và đa số mọi người sẽ đồng nhất nó với "Mario".
    • Không khó để dùng công cụ AI mô tả các hình ảnh giống Mario rồi loại bỏ các kết quả như vậy khỏi đầu ra khi có yêu cầu như "thợ sửa ống nước trong trò chơi điện tử".
  • Tóm tắt bình luận thứ bảy:

    • Tiền lệ pháp lý cho AI tạo sinh tương tự việc Google thu thập dữ liệu từ website và lập chỉ mục để phục vụ tìm kiếm.
    • Không ai nói rằng việc Google hiển thị nguyên văn nội dung gốc của website là vi phạm bản quyền.
    • Nếu AI tạo sinh phải loại bỏ toàn bộ tham chiếu văn hóa và tài sản trí tuệ (IP) phổ biến, nó sẽ trở nên vô dụng.
  • Tóm tắt bình luận thứ tám:

    • Đây là một cân nhắc về vấn đề vi phạm bản quyền trong trường hợp thuê session musician chơi một phần của bài hát nổi tiếng rồi dùng nó làm sample.
    • Câu hỏi được đặt ra là ai phải chịu trách nhiệm cho hành vi vi phạm bản quyền.
  • Tóm tắt bình luận thứ chín:

    • Đề cập đến một chuỗi thảo luận liên quan đang diễn ra, trong đó The New York Times yêu cầu tiêu hủy tất cả các large language model (LLM) đã được huấn luyện trên dữ liệu của họ.
  • Tóm tắt bình luận thứ mười:

    • Thông qua một thí nghiệm về mức độ Llama2 nén văn bản tốt đến đâu, người ta phát hiện mô hình này chứa một phần đáng kể chương đầu của cuốn Harry Potter.