Công nghệ giọng nói chung
(commonvoice.mozilla.org)Giới thiệu dự án Mozilla Common Voice
- Mozilla Common Voice là một dự án giúp máy móc học được cách con người thực sự nói.
- Để công nghệ giọng nói có thể sử dụng được, các nhà phát triển cần một lượng dữ liệu giọng nói khổng lồ.
- Phần lớn dữ liệu đang được các tập đoàn lớn sử dụng và đa số mọi người không thể tiếp cận, điều này được cho là đang cản trở đổi mới.
Tình trạng ghi nhận và xác minh dữ liệu giọng nói
- Tính đến nay, đã có 29.000 giờ giọng nói được ghi lại, trong đó 18.000 giờ đã được xác minh.
Hỗ trợ nhiều ngôn ngữ
- Dự án Common Voice hỗ trợ nhiều ngôn ngữ trên toàn thế giới và người dùng có thể đóng góp bằng ngôn ngữ của mình.
Hỗ trợ xây dựng bộ dữ liệu công khai chất lượng cao
- Bạn có thể đóng góp mà không cần tạo hồ sơ, nhưng cũng có thể cung cấp dữ liệu nhân khẩu học ẩn danh để làm phong phú thêm dữ liệu đã gửi.
- Thông tin hồ sơ giúp nâng cao chất lượng dữ liệu âm thanh dùng để huấn luyện độ chính xác của nhận dạng giọng nói.
- Người dùng có thể theo dõi tiến độ và các chỉ số của mình trên nhiều ngôn ngữ.
- Có thể so sánh tiến độ với những người đóng góp khác trên toàn thế giới.
- Có thể kiểm tra tiến độ đối với các mục tiêu cá nhân và mục tiêu của dự án.
- Nếu muốn, bạn có thể tự nguyện đăng ký vào danh sách email để nhận cập nhật dự án và thông tin mới.
Ý kiến của GN⁺
Điểm quan trọng nhất của bài viết này là Mozilla đã khởi động dự án Common Voice nhằm cung cấp lượng dữ liệu giọng nói quy mô lớn cần thiết cho các nhà phát triển muốn xây dựng công nghệ nhận dạng giọng nói. Dự án này cho thấy nỗ lực của Mozilla trong việc thúc đẩy đổi mới công nghệ, đồng thời mở ra cơ hội để nhiều người trên khắp thế giới đóng góp cho sự phát triển công nghệ thông qua việc hỗ trợ đa dạng ngôn ngữ. Điều này phản ánh triết lý theo đuổi dân chủ hóa công nghệ của Mozilla và sẽ là một sáng kiến thú vị, hấp dẫn đối với nhiều người.
1 bình luận
Ý kiến Hacker News