7 điểm bởi GN⁺ 2024-05-21 | 9 bình luận | Chia sẻ qua WhatsApp
  • Tuyên bố do đại diện truyền thông của Johansson, Marcel Pariseau, cung cấp cho NPR. Bản dịch máy sang tiếng Hàn

    "Tháng 9 năm ngoái, tôi nhận được đề nghị từ Sam Altman về việc đảm nhận vai trò giọng nói cho hệ thống ChatGPT 4.0 hiện tại. Ông ấy nói rằng tôi có thể giúp thu hẹp khoảng cách giữa các công ty công nghệ và các nhà sáng tạo, đồng thời giúp người tiêu dùng cảm thấy thoải mái trước sự thay đổi mang tính địa chấn trong nhận thức về con người và AI. Ông ấy cũng nói rằng giọng nói của tôi có thể mang lại sự an ủi cho mọi người.

    Sau nhiều cân nhắc, tôi đã từ chối đề nghị đó vì lý do cá nhân. Chín tháng sau, bạn bè, gia đình và công chúng đã chỉ ra rằng hệ thống mới mang tên "Sky" giống giọng tôi đến mức nào.

    Khi nghe bản demo được công bố, tôi đã bị sốc, phẫn nộ và không thể tin nổi khi biết rằng ông Altman đã theo đuổi một giọng nói giống giọng tôi đến mức ngay cả những người bạn thân nhất và các cơ quan báo chí cũng khó phân biệt. Ông Altman thậm chí còn ám chỉ rằng sự tương đồng đó là có chủ đích khi đăng tweet một từ duy nhất là "her", nhắc đến bộ phim "Her", trong đó tôi từng lồng tiếng cho Samantha, hệ thống trò chuyện đã hình thành mối quan hệ thân mật với con người.

    Hai ngày trước khi bản demo ChatGPT 4.0 được công bố, ông Altman đã liên hệ với người đại diện của tôi để đề nghị tôi cân nhắc lại một lần nữa. Trước cả khi chúng tôi có thể kết nối lại, hệ thống đó đã được phát hành rồi.

    Vì hành động của họ, tôi buộc phải tìm đến tư vấn pháp lý, và luật sư của tôi đã gửi hai lá thư cho ông Altman và OpenAI để yêu cầu giải thích chính xác những gì họ đã làm cũng như quy trình tạo ra giọng nói "Sky". Cuối cùng, OpenAI miễn cưỡng đồng ý gỡ bỏ giọng nói "Sky".

    Trong thời điểm tất cả chúng ta đang vật lộn với deepfake cũng như việc bảo vệ quyền đối với hình ảnh, tác phẩm và bản sắc của chính mình, tôi tin rằng những vấn đề này đòi hỏi sự rõ ràng tuyệt đối. Tôi mong chờ một giải pháp dưới hình thức thông qua luật phù hợp để bảo đảm tính minh bạch và bảo vệ quyền của cá nhân."

9 bình luận

 
botplaysdice 2024-05-22

Không biết phía OpenAI sẽ phản hồi thế nào đây.

Hay là họ sẽ nói kiểu: 'Giọng này không phải của bạn. Giọng của bạn là đây.' rồi cho nghe bản sao giọng Scarlett Johansson được tái tạo hoàn hảo thật sao?

Cách xử lý này hơi đáng tiếc nhỉ. Có lẽ là tác dụng phụ của sự quá tự tin chăng...

 
lcanon 2024-05-21

Mong rằng chuyện này sẽ giáng một đòn đủ mạnh để phá vỡ hẳn câu châm ngôn đặc trưng của ngành này: 'Xin tha thứ còn dễ hơn xin phép.' Nếu họ có thể cư xử như vậy với một ngôi sao Hollywood, thì biết đâu họ còn gửi cả sát thủ đến với những lời phản đối của người bình thường.

 
shalome7 2024-05-21

Cá nhân tôi thấy rằng giọng Sky đã được phát hành từ 6 tháng trước và ai cũng có thể dùng qua ứng dụng iOS, nhưng khi đó chưa từng trở thành chủ đề gây bàn tán vì giống Scarlett Johansson hay phim Her... (ngay cả trên reddit, hn v.v., những người đã dùng thử cũng nói rằng nó không đến mức dễ bị nhầm là cùng một giọng..) Tôi cũng thấy rằng nếu bây giờ thử đặt Sky thì đúng là có thể nhận ra đây là kiểu giọng mang cảm giác Scarlett Johansson trong Her, nhưng tôi không cảm thấy đó là cùng một giọng.
Trong trường hợp như vậy, tôi vẫn nghi ngờ liệu việc Scarlett Johansson khẳng định quyền đối với giọng nói có thực sự hợp lý hay không.

Demo từng được đăng trước đây: https://www.youtube.com/watch?v=RcgV2u9Kxh0

Biết trước đó là Scarlett Johansson rồi nghe lại thì đúng là có phần giống Scarlett Johansson thật... haha

 
eungook 2024-05-22

Hy vọng giờ thì bạn đã đổi ý.

 
bbulbum 2024-05-21

Chà... dù sao thì đây cũng là một công ty được cho là đang dẫn dắt ngành AI mà...

 
xguru 2024-05-21

OpenAI cũng đã đăng riêng bài viết về cách lựa chọn các giọng nói cho ChatGPT liên quan đến vấn đề này.

Quy trình lựa chọn giọng nói cho ChatGPT

  • Chế độ giọng nói của ChatGPT là một trong những tính năng được người dùng yêu thích
  • 5 giọng nói giàu cá tính (Breeze, Cove, Ember, Juniper, Sky) đã được lựa chọn cẩn thận thông qua một quy trình quy mô lớn kéo dài 5 tháng
  • Có sự tham gia của diễn viên lồng tiếng chuyên nghiệp, agency, giám đốc tuyển chọn diễn viên và các cố vấn trong ngành

Hỗ trợ cộng đồng sáng tạo và hợp tác với ngành lồng tiếng

  • OpenAI hỗ trợ cộng đồng sáng tạo và hợp tác chặt chẽ với ngành lồng tiếng để tuyển chọn diễn viên lồng tiếng
  • Mỗi diễn viên lồng tiếng nhận được mức thù lao ngang hoặc cao hơn mức hàng đầu thị trường, và việc chi trả sẽ tiếp tục chừng nào giọng nói còn được sử dụng trong sản phẩm
  • OpenAI tin rằng giọng nói AI không nên cố ý mô phỏng giọng đặc trưng của người nổi tiếng
  • Giọng nói của Sky không phải là bắt chước Scarlett Johansson mà là giọng tự nhiên của một nữ diễn viên chuyên nghiệp khác
  • Không công bố tên để bảo vệ quyền riêng tư của các diễn viên lồng tiếng

Hợp tác với giám đốc tuyển chọn và nhà sản xuất từng đoạt giải để thiết lập tiêu chí giọng nói

  • Đầu năm 2023, OpenAI đã hợp tác với các giám đốc tuyển chọn và nhà sản xuất độc lập, danh tiếng và từng đoạt giải để chọn diễn viên lồng tiếng
  • Các tiêu chí cho giọng nói của ChatGPT được xây dựng bằng cách cân nhắc kỹ cá tính riêng của từng giọng và sức hấp dẫn đối với khán giả toàn cầu
  • Các tiêu chí bao gồm xuất thân đa dạng hoặc có khả năng đa ngôn ngữ, giọng nói vượt thời gian, tạo cảm giác tin cậy, ấm áp, cuốn hút và truyền sự tự tin

Diễn viên lồng tiếng và diễn viên màn ảnh với hơn 400 đơn ứng tuyển

  • Vào tháng 5/2023, agency tuyển chọn và giám đốc tuyển chọn đã đăng thông báo tuyển dụng nhân tài
  • Chỉ trong 1 tuần đã nhận được hơn 400 đơn ứng tuyển
  • Các diễn viên thử giọng bằng cách nhận kịch bản phản hồi của ChatGPT rồi thu âm

Chọn ra 5 giọng nói cuối cùng và thảo luận với diễn viên về tầm nhìn tương tác với giọng nói AI

  • Trong suốt tháng 5/2023, đội tuyển chọn đã đánh giá độc lập và chọn ra 14 diễn viên
  • Trước khi gửi các giọng nói vào vòng chung kết cho OpenAI, họ tiếp tục được tinh chỉnh thêm
  • OpenAI đã thảo luận với từng diễn viên về tầm nhìn đối với tương tác bằng giọng nói AI cũng như năng lực, giới hạn, rủi ro và các biện pháp an toàn của công nghệ
  • Điều quan trọng là các diễn viên phải hiểu phạm vi và mục đích của chế độ giọng nói trước khi cam kết với dự án
  • Sau khi đội ngũ nội bộ OpenAI xem xét các giọng nói từ góc độ sản phẩm và nghiên cứu, các giọng cuối cùng đã được chọn sau quá trình cân nhắc kỹ lưỡng

Mời diễn viên đến San Francisco để thu âm và phát hành giọng nói ChatGPT

  • Trong tháng 6 và 7, các diễn viên được mời đến San Francisco để tham gia các buổi thu âm và gặp trực tiếp đội ngũ sản phẩm và nghiên cứu của OpenAI
  • Ngày 25/9/2023, OpenAI phát hành tính năng giọng nói cho ChatGPT
  • Toàn bộ quá trình kéo dài 5 tháng với sự hợp tác sâu rộng cùng các diễn viên và đội tuyển chọn
  • OpenAI đang tiếp tục hợp tác với các diễn viên cho nghiên cứu âm thanh của GPT-4o và các tính năng giọng nói mới

Kế hoạch giới thiệu chế độ giọng nói mới của GPT-4o cho người dùng trả phí và bổ sung thêm giọng nói

  • Trong vài tuần tới, OpenAI dự kiến cung cấp bản alpha của chế độ giọng nói mới của GPT-4o cho người dùng ChatGPT Plus
  • Với GPT-4o, người dùng có thể tương tác với ChatGPT bằng giọng nói một cách tự nhiên hơn nhiều
  • GPT-4o có thể xử lý ngắt lời mượt mà, quản lý hội thoại nhóm hiệu quả, lọc tiếng ồn nền và thích nghi với tông giọng
  • Trong tương lai, OpenAI có kế hoạch bổ sung thêm các giọng nói cho ChatGPT để phù hợp hơn với nhiều mối quan tâm và sở thích đa dạng của người dùng
 
GN⁺ 2024-05-21
Ý kiến trên Hacker News

Tóm tắt các bình luận trên Hacker News

  • Xung đột giữa OpenAI và Scarlett Johansson

    • OpenAI đã tiếp cận Scarlett Johansson nhưng bị từ chối. Hai ngày trước khi ra mắt GPT-4o, họ lại liên hệ với người đại diện của cô nhưng không nhận được phản hồi. Cuối cùng, OpenAI đã trình diễn một sản phẩm mô phỏng giọng nói của cô. Sau đó, khi đội ngũ pháp lý của Scarlett gửi yêu cầu, OpenAI đã gỡ giọng nói đó khỏi sản phẩm.
  • Hành động quá đáng của OpenAI

    • Có ý kiến cho rằng việc OpenAI nhiều lần cố thuê Johansson nhưng không thành, rồi lại bắt chước giọng của cô, là hành vi không đúng đắn.
  • Chỉ trích bản demo ChatGPT-4o

    • Có ý kiến cho rằng nỗ lực của Altman nhằm sao chép "cô ấy" là phản cảm. Việc Johansson quyết định không tham gia được đánh giá là một lựa chọn đúng đắn. Điều này cũng cho thấy rõ rằng engine TTS vẫn đang được sử dụng.
  • Phát biểu của Mira Murati

    • Có ý kiến cho rằng phát biểu của Murati, rằng chế độ giọng nói của GPT-4o được lấy cảm hứng từ khía cạnh tự nhiên của hội thoại giữa con người hơn là từ bộ phim 'Her', là rất đáng chú ý. Việc Murati khựng lại trước câu hỏi có vẻ là để tránh rắc rối pháp lý.
  • Tweet của Sam

    • Có ý kiến cho rằng tweet của Sam đã cung cấp mọi bằng chứng mà đội ngũ pháp lý của Scarlett Johansson cần.
  • Vấn đề pháp lý

    • Giọng Sky bị cho là không phải đang bắt chước Scarlett Johansson ngoài đời, mà là phiên bản của cô trong phim 'Her'. Có thảo luận pháp lý xoay quanh việc giọng của diễn viên lồng tiếng bị mô hình AI chiếm dụng. Tùy theo hợp đồng của Johansson, địa vị pháp lý có thể khác nhau.
  • Lựa chọn của Johansson

    • Có ý kiến cho rằng việc Johansson từ bỏ một khoản tiền bản quyền lớn và cơ hội hợp tác là điều đáng chú ý. Có thể hiểu được sự khó chịu của cô khi giọng nói của mình bị sử dụng không được phép. Điều này tương tự như việc lập trình viên thấy mã của mình bị AI sử dụng trái phép.
  • Phản ứng pháp lý

    • Có ý kiến cho rằng OpenAI lùi bước vì Johansson có đủ khả năng tài chính để thuê luật sư. Điều này làm dấy lên lo ngại rằng Altman và OpenAI có thể dễ dàng xâm phạm quyền của người khác.
  • Trường hợp của Weird Al Yankovic

    • Có ý kiến cho rằng nên noi theo ví dụ của Weird Al Yankovic, người đã đạt được điều mình muốn mà vẫn tôn trọng khái niệm đồng thuận.
  • Kêu gọi hành động pháp lý

    • Có ý kiến hy vọng Johansson sẽ khởi kiện công ty để tạo tiền lệ. Cô có đủ nguồn lực để theo đuổi vụ việc, và công ty cũng xứng đáng bị như vậy.
 
[Bình luận này đã bị ẩn.]