Nền tảng cá tính chatbot AI tùy chỉnh: Alpha test BooCae
(boocae.oopy.io)Có lẽ mọi người ở đây cũng nghĩ giống tôi,
đó là muốn thực sự tạo ra Jarvis của Iron Man.
Tôi xin công bố miễn phí phiên bản alpha test của dịch vụ nền tảng cá tính chatbot AI tùy chỉnh mang tên 'BooCae' (nhân cách phụ), và mong nhận được nhiều ý kiến khác nhau như lỗi hoặc điểm cần cải thiện.
Đúng như tên gọi alpha test, mong mọi người xem đây là một thử nghiệm mang tính thực nghiệm; tôi vẫn đang tiếp tục bổ sung thêm các tính năng.
‘BooCae’ hướng tới trở thành một nền tảng ‘cá tính chatbot AI tùy chỉnh’, kết hợp ChatGPT làm nền tảng với nhiều mô hình AI siêu lớn như LLAMA, ALPACA cùng nhiều API và plugin khác nhau.
Các chatbot AI của BooCae hiện cùng dựa trên ChatGPT-3.5-Turbo API, và phần ‘huấn luyện tùy chỉnh’ cho từng lĩnh vực được cấu hình độc lập. Dịch vụ alpha test này cũng bao gồm avatar AI đa phương thức và có thể vận hành được.
Mô hình tạo avatar bằng AI được tôi phát triển riêng dưới dạng 'native app', hiện vẫn đang thử nghiệm ngoại tuyến và chưa đăng lên store. (Phần này tôi sẽ giới thiệu riêng sau.)
Trùng hợp là ở Mỹ cũng có một mô hình tương tự là 'Character.AI', và trong khi tham khảo trang đó, tôi đã cố gắng cải tiến và tạo điểm khác biệt theo cách riêng.
Cấu trúc của cấu hình dịch vụ cơ bản, các điểm khác biệt, v.v. như sau.
-AI model: Đã áp dụng ChatGPT làm mặc định, và sắp tới sẽ bổ sung thêm các GPT khác như Alpaca và LLaMA. Với ChatGPT, nền tảng sử dụng GPT3.5-TURBO thông qua Open API. (Tất nhiên cũng phải tính đến tốc độ phản hồi và chi phí.)
-AI persona: Mặc định sử dụng bộ prompt tiêu chuẩn được định nghĩa là AI assistant, và có chỉnh sửa đôi chút để phù hợp với bối cảnh Hàn Quốc. Phần này cũng sẽ tiếp tục được cập nhật thêm.
-Bộ dữ liệu huấn luyện bổ sung tùy chỉnh: Dựa trên thông tin công khai (cổng thông tin dữ liệu công, thông tin công khai không có bản quyền, v.v.), tôi đã thử nghiệm cho hệ thống học các nội dung như tin tức, từ điển, và đang tiếp tục cải thiện cả số lượng lẫn chất lượng. Về sau, tôi cho rằng cũng sẽ cần mua dữ liệu chuyên môn trả phí.
-API tra cứu thông tin thời gian thực: Để tận dụng dữ liệu có tính thời gian thực (ví dụ như tỷ giá hối đoái), tôi đã dùng nhiều API và vẫn đang tiếp tục bổ sung thêm. Việc tra cứu API thời gian thực này cũng là một điểm cần cân nhắc về chi phí.
-Nền tảng chatbot: Từ bản công khai đến bản thương mại hiện có nhiều nền tảng chatbot khác nhau, nên tôi đã sử dụng module và API của nhiều nền tảng chatbot và muốn hỗ trợ được thêm nhiều nền tảng hơn nữa.
Các nền tảng chatbot nhìn chung dựa trên cấu trúc cho phép thiết lập điều kiện như kịch bản. Hoặc là ChatGPT đã được tích hợp sẵn làm mặc định (trong trường hợp này, thực tế có khá nhiều trường hợp hơi khó coi đó là một nền tảng chatbot đúng nghĩa), hoặc là chưa tích hợp sẵn nhưng có API mở nên có thể cấu hình API thủ công để kết nối ChatGPT.
Tôi cho rằng cả hai cách đều có những ưu điểm riêng.
Điều quan trọng là mở rộng tính đa dạng để có thể tự do hỗ trợ nhiều nền tảng hơn.
-Triển khai và phân phối: Có thể định nghĩa theo dạng web widget, URL link, hoặc API; nhờ đó có thể hỗ trợ đa nền tảng như web/web app/native app, hoặc các dịch vụ giọng nói như Google Assistant.
-Chức năng tìm kiếm: Để đăng ký và tận dụng từ khóa, chức năng tìm kiếm được áp dụng nguyên trạng từ những gì Notion cung cấp, và tôi thấy cấu trúc DB của nó cũng rất hữu ích.
-Quảng cáo: Khi cân nhắc mô hình doanh thu, tôi đã thử nghiệm áp dụng theo tiền đề là hiển thị quảng cáo tài trợ mỗi khi AI trả lời.
Hình thức quảng cáo theo tôi gồm 1) video 2) hình ảnh 3) văn bản và URL 4) lồng ghép nội dung mang tính PPL vào câu trả lời.
-AI avatar: Điểm khác biệt lớn nhất được chuẩn bị nằm ở khía cạnh đa phương thức. Tôi cho rằng avatar AI đa phương thức đúng nghĩa mà BooCae định nghĩa là sự kết hợp tổng hợp của tạo văn bản bằng AI, tạo/sao chép/tổng hợp giọng nói, tạo hình ảnh, tổng hợp thành video, xử lý video như hậu cảnh, v.v.
Phần lớn hình ảnh video được công bố trong alpha test của BooCae được tạo bằng Wav2LIP và các công cụ tương tự; qua thử nghiệm trước đó, tôi nhận thấy phản ứng của người dùng rõ ràng tốt hơn, nên đã tập trung đây như một điểm khác biệt.
Nền tảng dịch vụ sử dụng 'Notion', còn site được xây dựng bằng oopy.
Các danh mục dịch vụ được định nghĩa thành vài chục loại và tôi tin rằng sẽ còn tiếp tục được bổ sung.
Theo cấu trúc class của dịch vụ, chúng được phân loại thành Special (đặc biệt), Brand (doanh nghiệp hoặc dịch vụ thương hiệu), Expert (dịch vụ chuyên gia), Ready (đang huấn luyện), Comming soon (đang chờ huấn luyện).
Trong phần thông báo cũng có kèm đơn khảo sát để tìm hiểu phản hồi về dịch vụ và lắng nghe ý kiến, nên rất mong nhận được nhiều góp ý thẳng thắn.
Vì vẫn đang ở giai đoạn alpha test nên còn rất nhiều thiếu sót.
Chúng tôi cũng cần một đội ngũ để cùng xây dựng dự án. Nếu bạn quan tâm, rất cảm ơn nếu có thể nhắn qua chat.
URL alpha test: https://boocae.oopy.io/
Chưa có bình luận nào.