Paul McCartney dùng AI để tạo ca khúc mới của The Beatles
(techcrunch.com)- Dự kiến sẽ phát hành ca khúc mới vào cuối năm nay
- Bao gồm phần giọng hát của John Lennon được trích xuất từ bản demo thu âm ca khúc "Now and Then" năm 1978
- AI đã được dùng để loại bỏ tạp âm và tách các phần từ những bản thu của các thành viên The Beatles trước đây, giúp có thể phát lại với chất lượng cao
- Năm 1995, các thành viên còn lại từng định thu âm ca khúc này, nhưng do chất lượng track của John Lennon không tốt nên George Harrison được cho là đã phản đối giữa chừng
- Lần này, phần giọng hát đã được phục hồi sạch sẽ như thể vừa mới thu âm
- McCartney vẫn tỏ ra đôi chút hoài nghi về việc dùng AI để tạo ra âm nhạc về bản chất nghe như bản thu gốc của John Lennon
"Vì đây là tương lai, nên nó vừa hơi đáng sợ nhưng cũng rất thú vị."
"Chúng ta sẽ phải xem điều này sẽ dẫn tới đâu."
6 bình luận
Thực tế là trong các lĩnh vực như OCR hay xử lý ngôn ngữ tự nhiên (ví dụ trình dịch), những cách tiếp cận thuật toán cổ điển từ trước đến khoảng thập niên 2010 đã không cho thấy bước tiến thật sự tốt, và cũng đúng là các mô hình mạng nơ-ron sâu dựa trên CNN, RNN đã cho độ chính xác cao trong những lĩnh vực đó và nhanh chóng thay thế nền tảng công nghệ cũ. Bây giờ còn bao nhiêu công ty đang dùng trình dịch dựa trên phân tích ngữ pháp truyền thống nữa nhỉ?
Trong lĩnh vực phục hồi chất lượng âm thanh cũng vậy, dù trước đây đã có các phương pháp nội suy hay thuật toán phục hồi truyền thống, nhưng nếu chất lượng phục hồi dựa trên mô hình AI vượt trội hơn hẳn so với chúng thì tôi nghĩ ngành công nghiệp đương nhiên sẽ chọn hướng này.
Ngay cả những công ty phần mềm âm thanh/audio hàng đầu thế giới như iZotope hiện cũng có rất nhiều nhà nghiên cứu AI trong nội bộ, và chỉ nhìn vào các giải pháp như iZotope RX thôi cũng có thể thấy họ đang tích cực áp dụng và cung cấp công nghệ AI để loại bỏ nhạc cụ hoặc giọng hát cụ thể khỏi bản nhạc trong các phiên bản mới nhất.
Có một ứng dụng mã nguồn mở tên là Ultimate Vocal Remover cho mô hình tách giọng hát, hãy thử dùng xem. Hiệu năng thực sự rất tốt.
Các kỹ thuật phục dựng bằng AI đủ loại, ít nhất là với các nhạc sĩ điện tử ngày nay, đã được phổ cập và xem là chuyện hiển nhiên từ khá lâu rồi, nên tôi khá tò mò không biết họ đã dùng cụ thể công nghệ gì mà lại gây ra phản ứng như vậy.
Bài gốc thì đang cố gượng gạo gắn tin này với AI tạo sinh, nhưng đây là một công nghệ cần được nhìn nhận là hoàn toàn tách biệt với bên đó.
Nhưng nếu họ đã dùng một kiểu ứng dụng như Enhanced Speech from Adobe, nơi kết quả đầu ra bị đẩy đến mức cực đoan và thậm chí còn không cung cấp tham số để điều chỉnh, thì đây cũng là một phản ứng hoàn toàn dễ đồng cảm thôi.
https://www.techno-edge.net/article/2023/06/14/1436.html
Đây là một bài viết từ phía Nhật, và có vẻ như George Harrison cũng không mấy hứng thú, đến mức gọi nó là 'fxxxing rubbish'.
https://n.news.naver.com/mnews/article/025/0003286946
Bài báo này cho biết tình trạng bản ghi âm của John Lennon không được như mong muốn.
Có ghi rằng vào thời điểm thu âm ca khúc này, ông ấy không mấy hứng thú.