Dự án mã nguồn mở biến âm thanh phát ra bằng miệng thành sound effect (New UX for sound generation)
(github.com/thxxx)Xin chào, mình đã tạo một mô hình và phát hành nó dưới dạng mã nguồn mở nên muốn chia sẻ với mọi người.
Bạn đã bao giờ cần một âm thanh cụ thể để làm video hoặc game chưa?
Trong đầu bạn biết rất rõ đó là âm thanh như thế nào, nhưng có lẽ bạn không có cách nào để diễn đạt và tìm kiếm nó.
Vì lý do đó, nếu tham gia các buổi họp liên quan đến âm thanh của các studio game, bạn sẽ nghe những kiểu âm này nhiều hơn cả hội thoại.
“Phiu phiu- thì không bằng piu↘︎piu↘︎ sẽ hay hơn”
Vì thế mình đã làm ra nó!
Mô hình mình tạo là một mô hình mà bạn bắt chước âm thanh mong muốn bằng miệng, rồi đưa nó cùng với văn bản vào model làm input, sau đó model sẽ tạo ra sound effect đó. (đã dùng khá nhiều thời gian và dữ liệu)
repo: https://github.com/thxxx/VTS
demo: https://spicy-pufferfish-699.notion.site/VTS-347cf95761f480f19dc0eb790…
(Nếu vào link demo và nghe thử thì bạn sẽ hiểu rõ hơn nhiều ý nghĩa của nó haha)
1 bình luận
Cái này vui phết nhé haha