Trình khám phá persona người Hàn dựa trên Nemotron-Personas-Korea
(microworld.dev)Đây là trình khám phá persona người Hàn sử dụng bộ dữ liệu Nemotron-Personas-Korea do NVIDIA công bố.
Bộ dữ liệu này là một bộ dữ liệu tổng hợp quy mô 1 triệu người Hàn, bao gồm độ tuổi, nghề nghiệp, khu vực, quan hệ gia đình, v.v. Cách tạo bộ dữ liệu và thông tin thống kê được giải thích chi tiết tại https://vi.news.hada.io/topic?id=28919.
Các tính năng chính của trình khám phá persona như sau.
-
Có thể tìm kiếm persona hoặc tìm các persona tương tự. Độ tương đồng được so sánh bằng mô hình embedding của Qwen.
-
Có thể xem phân bố dân số của persona trên bản đồ. Sử dụng thông tin vị trí có trong bộ dữ liệu.
-
Có thể trò chuyện với persona. Có thể trả lời những câu hỏi rất đơn giản.
Toàn bộ bộ dữ liệu đã được trích xuất embedding 1024 chiều bằng mô hình embedding Qwen 0.6 và được tạo thành bộ dữ liệu trên Hugging Face. Do cột *_persona có đặc điểm tên được lặp lại nhiều lần, embedding có thể mang giá trị bị lệch theo tên.
- Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings
Chưa có bình luận nào.