- Cho phép tạo dữ liệu âm thanh chất lượng cao dài tối đa 47 giây từ các lời nhắc văn bản đơn giản
- Nhờ quá trình huấn luyện chuyên biệt, đây là lựa chọn lý tưởng để tạo nhịp trống, đoạn riff nhạc cụ, âm thanh ambient, bản ghi foley và các mẫu âm thanh khác phục vụ sản xuất âm nhạc và thiết kế âm thanh
- Ưu điểm chính của bản phát hành mã nguồn mở này là người dùng có thể tinh chỉnh mô hình trên dữ liệu âm thanh tùy chỉnh của riêng mình
- Ví dụ, một tay trống có thể tinh chỉnh trên các mẫu ghi âm tiếng trống của mình để tạo ra các nhịp mới
- Khác gì với Stable Audio?
- Stable Audio, sản phẩm thương mại, cung cấp các bản nhạc hoàn chỉnh chất lượng cao với cấu trúc âm nhạc nhất quán dài tới 3 phút, cùng các tính năng nâng cao như audio-to-audio generation và sáng tác nhạc nhiều phần nhất quán
- Trong khi đó, Stable Audio Open được chuyên biệt hóa cho các mẫu âm thanh, hiệu ứng âm thanh và các thành phần phục vụ sản xuất
- Dù có thể tạo các clip nhạc ngắn, nó không được tối ưu cho bài hát hoàn chỉnh, giai điệu hoặc giọng hát
- Mô hình mở này mang lại góc nhìn về AI tạo sinh cho thiết kế âm thanh, đồng thời ưu tiên phát triển có trách nhiệm cùng cộng đồng sáng tạo
- Trọng số mô hình Stable Audio Open hiện có trên Hugging Face
- Các sound designer, musician, developer và người yêu âm thanh được khuyến khích tải mô hình về, khám phá các khả năng của nó và gửi phản hồi
Chưa có bình luận nào.