- Trợ lý giọng nói AI đang thay đổi mang tính cách mạng cách con người tương tác với công nghệ, nhưng các cuộc trò chuyện với trợ lý giọng nói hiện nay vẫn có thể tạo cảm giác máy móc và gượng gạo
- Vẫn gặp khó khăn trong việc hiểu và thích nghi với những sắc thái tinh tế và cảm xúc trong hội thoại của con người
- Nếu một trợ lý giọng nói hoàn toàn mở được hiện thực hóa theo cách này thì sao?
- Phản hồi yêu cầu của người dùng theo thời gian thực, với giọng nói tự nhiên cùng khả năng đồng cảm và trí tuệ cảm xúc
- Hiểu ngữ cảnh dài hạn của các cuộc trò chuyện trước đó, đồng thời xử lý hội thoại nhiều người, sự ngắt lời, xác nhận và cả những khoảng dừng để suy nghĩ
- Hoạt động hoàn toàn cục bộ trên phần cứng tiêu dùng
Phát triển BUD-E (Buddy for Understanding and Digital Empathy)
- LAION đã phát triển BUD-E với sự hợp tác của ELLIS Institute Tübingen, Collabora và Tübingen AI Center
- Bắt đầu từ việc phát triển một trợ lý giọng nói nền tảng có độ trễ thấp, và tính đến tháng 1 năm 2024 đã đạt độ trễ 300~500ms
- Kỳ vọng có thể đạt thời gian phản hồi dưới 300ms khi sử dụng mô hình lớn hơn
Lộ trình phát triển BUD-E
- Ngay cả hội thoại với mô hình cơ bản cũng tự nhiên hơn rất nhiều so với những gì từng thấy trước đây
- Tuy nhiên vẫn còn nhiều vấn đề cần giải quyết và nhiều tính năng cần phát triển
- Giảm độ trễ và tối thiểu hóa yêu cầu hệ thống
- Tăng mức độ tự nhiên của hội thoại và phản hồi
- Theo dõi hội thoại kéo dài nhiều ngày, nhiều tháng, nhiều năm
- Nâng cao tính năng và năng lực của trợ lý giọng nói
- Cải thiện khả năng hiểu ngữ cảnh đa phương thức và cảm xúc
- Xây dựng hạ tầng giao diện người dùng, tích hợp liên tục và đóng gói dễ dàng
- Mở rộng sang đa ngôn ngữ và đa người nói
Hợp tác để xây dựng tương lai của AI hội thoại
- Việc phát triển BUD-E là một quá trình liên tục, đòi hỏi nỗ lực tập thể từ nhiều cộng đồng khác nhau
- Mời các nhà phát triển mã nguồn mở, nhà nghiên cứu và những người đam mê tham gia cải thiện từng mô-đun của BUD-E và đóng góp cho sự phát triển của dự án
- Hy vọng có thể cùng nhau tạo ra một trợ lý giọng nói AI có thể trò chuyện tự nhiên, trực quan và đầy đồng cảm
Chưa có bình luận nào.