7 điểm bởi kimchi 27 ngày trước | 4 bình luận | Chia sẻ qua WhatsApp

Đã gắn LLM vào Nemotron-Personas-Korea và chạy mô phỏng
bầu cử thị trưởng/tỉnh trưởng năm 2026.

Crawl 8.300 ứng viên từ NEC → lấy mẫu 5.100 persona, mỗi tỉnh/thành 300 người → mô phỏng 4.800 phiếu bằng Gemma 4 e4b (RTX 5060, 3 giờ).

Kết quả

Thị trưởng Daegu: Kim Han-gu (độc lập) 90,5% / Lee Jae-man (PPP) 8,2% / Kim Boo-kyum (Dân chủ) 1,4%

Cựu Thủ tướng + nghị sĩ 4 nhiệm kỳ + người gốc Daegu mà chỉ 1,4%. LLM bị hút theo nhãn "công nhân" của persona nên dồn phiếu cho ứng viên lao động độc lập.

Mẫu hình chung:

  • Thổi phồng quá mức lợi thế đương nhiệm (Gangwon: Kim Jin-tae 100%, Gyeongbuk: Lee Cheol-woo 99%)
  • Ghép khớp đơn giản theo nhãn nghề nghiệp
  • Khi thiếu thông tin thì tỷ lệ bỏ phiếu trắng/từ chối bỏ phiếu tăng vọt (Chungbuk 73%, Incheon 93%)

Kết luận

Mô phỏng persona bằng LLM không thể trở thành phương án thay thế cho thăm dò dư luận. Điều này xác nhận bằng định lượng rằng các nghiên cứu kiểu LLM-as-voter ở Mỹ không thể áp dụng nguyên xi vào chính trị Hàn Quốc.

4 bình luận

 
calmlake79 26 ngày trước

Tôi là người tạo ra "ManyPerson" trong mục "Bài viết nên xem cùng".
Đúng như bạn nói, mô phỏng persona bằng LLM không phải là vật thay thế cho khảo sát dư luận, mà là một "công cụ bổ trợ".
Tất nhiên, nếu đưa vào càng nhiều độ chính xác của persona và thông tin nền thì kết quả sẽ càng tiến gần hơn, nhưng về cơ bản bản thân tôi cũng đã xây dựng dịch vụ này với suy nghĩ đây là một dịch vụ mang tính bổ trợ hơn là một dịch vụ thay thế.
Dù vậy, tôi vẫn nghĩ nó hoàn toàn có đủ giá trị.

 

Tôi đồng ý!!

 
calmlake79 26 ngày trước

Giờ nhìn lại thì lúc nãy tôi hơi rối nên đang viết dở câu trả lời thì bỏ ngang mất;;

Trước hết, một trong những giá trị của phản hồi từ AI persona mà tôi thấy là...
điều lớn nhất là nó có thể mang lại góc nhìn rộng hơn cho người dùng hoặc người viết.

Bản thân tôi cũng cảm nhận được điều đó khi làm ra dịch vụ này: trước hết, góc nhìn về thế giới hay các sự kiện thực sự đã rộng ra hơn.
Từ "Tại sao lại nghĩ như thế về chuyện đó?" sang "À, hóa ra cũng có thể tiếp nhận và hiểu một sự việc theo cách như vậy..."
kiểu như thế, nên có thể nhìn mọi thứ theo hướng rộng hơn.
Tôi nghĩ trường hợp bầu cử mà bạn nói đến cũng sẽ tương tự.

Tôi vừa thử chạy một lần với đối tượng là Daegu giống như ví dụ trên, thì đúng là kết quả khá xa rời thực tế.

manyperson Link

Bên dịch vụ của chúng tôi cũng đã thử nghiệm theo cách tương tự, và đúng là kết quả không hẳn ra chính xác theo những gì tôi nghĩ, nhưng vẫn có thể xem được nhiều góc nhìn khác nhau. ( Tất nhiên do vấn đề cập nhật thông tin gần đây nên nó chưa thật sự chính xác, nhưng tôi nghĩ phần này rồi sẽ có thể được khắc phục dần bằng mặt kỹ thuật. )

Thật ra, ngay cả với chính dịch vụ của chúng tôi, trong lúc test tôi cũng từng chạy thử với suy nghĩ không biết mọi người sẽ nghĩ thế nào... và kết quả thì rất tích cực, nhưng thực tế ra sao thì hiện giờ tôi vẫn chưa chắc lắm ^^;;

 

Vì LLM suy luận theo đơn vị token văn bản, nên khi xuất hiện các nhãn tần suất cao, có vẻ những mẫu đã cùng xuất hiện với nhãn đó trong quá trình học sẽ được kích hoạt và có xu hướng lấn át các thông tin khác.

Ngoài ra, dù persona có các nhãn chi tiết đến đâu, hành vi bỏ phiếu của người đó cũng không được quyết định theo một hàm mà LLM có thể suy ra; thứ thực sự quyết định hành vi chính trị là quá nhiều yếu tố không có trong persona tổng hợp như lịch sử bỏ phiếu trước đây, đảng phái mà gia đình và đồng nghiệp ủng hộ, những tin tức gần đây họ đã xem, hay mức độ thiện cảm cá nhân với ứng viên.

Điều này dường như đồng thời tác động không chỉ riêng trường hợp này mà còn cả việc suy luận mọi tình huống/hiện tượng (cụ thể) về kinh tế và chính trị.