- Tạo các đoạn âm thanh chất lượng cao với nhiều phong cách khác nhau, tương tự AI tạo sinh hình ảnh/văn bản
- Cũng có thể chỉnh sửa các mẫu âm thanh được cung cấp
- Không chỉ tổng hợp ngôn ngữ ở 6 thứ tiếng mà còn có thể khử nhiễu, chỉnh sửa nội dung, chuyển đổi phong cách và tạo nhiều mẫu đa dạng
- Các AI tạo sinh cho giọng nói trước đây cần dữ liệu huấn luyện được chuẩn bị cẩn thận cho từng tác vụ. Voicebox được huấn luyện bằng dữ liệu âm thanh thô và dữ liệu phiên âm bằng một phương pháp mới
- Được huấn luyện bằng hơn 50.000 giờ sách nói thuộc phạm vi công cộng bằng tiếng Anh, Pháp, Tây Ban Nha, Đức, Ba Lan và Bồ Đào Nha
2 bình luận
Không biết có thể dùng nó để loại bỏ riêng phần giọng hát khỏi bài hát và tạo ra bản MR chất lượng cao hay không nhỉ
Đã có sẵn một mã nguồn mở khá dùng được cho việc đó:
https://github.com/Anjok07/ultimatevocalremovergui