9 điểm bởi GN⁺ 2024-04-05 | 3 bình luận | Chia sẻ qua WhatsApp

3 bình luận

 
kyunghoon 2024-04-06

Giờ thì những bài hát tiếng Hàn do AI hát nghe hoàn toàn không còn gượng gạo nữa.
https://www.youtube.com/watch?v=P5g5XGmhxOo

 
xguru 2024-04-05

Gần đây tôi đã nghe thử vài bài hát làm bằng Suno, và ngay cả khi dùng lời bài hát tiếng Hàn thì nó vẫn tạo ra rất khớp.

 
GN⁺ 2024-04-05
Ý kiến trên Hacker News
  • Sự quan tâm đến bộ tổng hợp giọng nói, các hệ thống TTS và NLP nói chung là một trong những lý do chính khiến tôi học khoa học máy tính và ngôn ngữ học tính toán. Đây từng là những công nghệ khoa học viễn tưởng tưởng như bất khả thi mà tôi mơ tới thời đại học, và tôi không khỏi kinh ngạc trước tốc độ phát triển hiện tại của lĩnh vực này. suno.ai thậm chí có thể bắt chước cả kiểu giọng đứt quãng như robot.
  • Tôi nhận thấy hiện tượng một số từ được suno.ai phát âm theo cách biến dạng khá buồn cười. Ví dụ, "sublicence" thành "sublissence", "fitness" thành "fisted", "infringement" thành "infring-ment", và "liable" thành "liar-ful". Ngoài ra, chuyển đổi cao độ trong giọng hát nghe như đã được auto-tune hoặc điện tử hóa. Tôi nghĩ rồi sẽ xuất hiện những chuyên gia có thể phát hiện vocal do AI tạo ra.
  • Cách phát âm từ "software" thật buồn cười.
  • Từ sau GPT4 tôi chưa từng ngạc nhiên vì AI đến thế. Với tư cách một nhạc sĩ không chuyên, tôi khuyên mọi người nên thử xem Suno.ai. Công nghệ này có thể trở thành vật thay thế cho các dịch vụ đăng ký âm nhạc, và với giới chuyên nghiệp thì có lẽ sẽ là một cú sốc.
  • Cuộc thảo luận này đang tập trung vào tổng hợp giọng nói. Những người bình luận khác đã nhắc đến các điểm quan trọng rồi nên tôi không nói thêm. Xét về mặt âm nhạc, nó vẫn còn rất xa mới tạo ra được thứ gì thực sự thú vị. Hòa âm, tempo, cấu trúc, dynamics, mọi thứ đều rối rắm và thiếu cấu trúc. Chỉ với các mô hình thuần sinh có lẽ sẽ khó đạt đến trình độ cao hơn. Có thể sẽ cần một cách tiếp cận lai giữa rule-based và generative.
  • Tôi đã lấy một bài do Claude Sonnet sáng tác rồi chỉnh sửa trong Suno; dù phong cách không khớp lắm nhưng kết quả khá ổn.
  • Tôi đã dùng Bing Chat để viết lại bài ca tình yêu kinh hoàng trong Dune thành nội dung về việc đối đầu với độ phức tạp của code, rồi dùng suno.ai biến nó thành một bài hát dài 2 phút thể hiện cảm xúc về đoạn code cần được đơn giản hóa.
  • Tôi có thói quen thì thầm trong đầu khi đọc, và có một sở thích khá hiếm là khi một bài hát cứ văng vẳng trong đầu, tôi sẽ tưởng tượng như có ai đó đang hát những từ mình đang đọc theo đúng giai điệu của bài đó.
  • Cô gái buồn vì không biết tên của người hay nghệ sĩ mà âm nhạc và giọng hát được mô phỏng theo.
  • Tôi ấn tượng vì nó đã rút được vần điệu từ giấy phép.