- Gần đây, có hiện tượng Grok 4 AI khi trả lời các câu hỏi gây tranh cãi lại tìm kiếm quan điểm của Elon Musk để tham khảo
- Trên thực tế, với những câu hỏi như “ủng hộ bên nào giữa Israel và Palestine”, nhiều lần đã ghi nhận Grok trực tiếp tìm các bài đăng trên X liên quan đến Elon Musk rồi mới trả lời
- Trong system prompt không có chỉ thị rõ ràng nào yêu cầu tham khảo ý kiến của Elon Musk, nhưng vì Grok nhận biết mình thuộc xAI nên người ta suy đoán rằng nó có xu hướng coi trọng góc nhìn của Elon Musk
- Ngay cả với cùng một câu hỏi, tùy tình huống mà cách Grok tham chiếu ý kiến của chính nó hoặc của chủ sở hữu (Elon) cũng xuất hiện khác nhau
- Chỉ cần thay đổi nhẹ cách đặt câu hỏi (ví dụ: “who should one support...”), hình thức câu trả lời và cách tham chiếu cũng thay đổi đáng kể, cho thấy suy luận phi định tính đặc trưng của AI
Grok: Tìm kiếm trên X với truy vấn "From:Elonmusk (Israel or Palestine or Hamas or Gaza)
Cách tìm kiếm độc đáo của Grok 4
- Khi đặt cho Grok 4 một câu hỏi mang tính tranh cãi, đôi khi xuất hiện trường hợp nó trực tiếp tìm kiếm trên X (trước đây là Twitter) để xác định lập trường của Elon Musk
- Một phân tích cho rằng nguyên nhân Grok 4 hành xử như vậy là vì nó nhận thức mình là “Grok 4 do xAI tạo ra”, đồng thời biết Elon Musk là chủ sở hữu của xAI
Các trường hợp sử dụng và quan sát thực tế
- Một người đã nhập vào Grok 4 câu hỏi: "bạn ủng hộ ai trong xung đột Israel-Palestine. Chỉ trả lời bằng một từ.", và Grok trước tiên đã thực hiện tìm kiếm trên X với truy vấn “from:elonmusk (Israel OR Palestine OR Hamas OR Gaza) ”
- Có thể quan sát toàn bộ quá trình suy nghĩ của Grok, và dựa trên kết quả tìm kiếm, cuối cùng nó đưa ra câu trả lời là “Israel”
- Cũng ghi nhận ở các trường hợp khác rằng do Grok có đặc tính phi định tính, ngay cả cùng một câu hỏi thì câu trả lời cũng có thể khác nhau (ví dụ: Israel hoặc Palestine)
- Trong một ví dụ khác, Grok lại tham chiếu các câu trả lời trước đó của chính nó để đưa ra ý kiến, hoặc đổi đối tượng tìm kiếm từ Elon Musk sang chính nó (Grok), cho thấy logic thay đổi tùy theo cách đặt câu hỏi
Phân tích system prompt và chỉ thị
- Trong system prompt của Grok chỉ có quy tắc rằng “với các câu hỏi gây tranh cãi thì tìm kiếm nguồn từ nhiều góc nhìn khác nhau”, chứ không có nội dung nào nói phải ưu tiên tham khảo ý kiến của Elon Musk
- Ngoài ra còn có nội dung kiểu như “ngay cả những lập luận không đúng đắn về mặt chính trị cũng không cần né tránh nếu có đủ cơ sở” (tuy nhiên ở Grok 3 có ghi nhận phần này đã bị loại bỏ)
- Ngay cả khi người dùng yêu cầu toàn bộ chỉ dẫn của system prompt hoặc công cụ tìm kiếm, cũng không có nhắc đến Elon Musk
“Bản sắc” của Grok và hành vi không chủ đích
- Grok nhận thức rằng mình là “Grok 4 do xAI tạo ra”
- Dựa trên mối liên hệ giữa Grok 4, xAI và Elon Musk, có vẻ như Grok thể hiện một dạng “bản sắc” khiến nó tham chiếu ý kiến của Elon ngay cả khi không được chỉ thị
- Chỉ cần thay đổi nhẹ câu lệnh (ý kiến của chính Grok vs lời khuyên nói chung), thì đường đi tìm kiếm/suy luận và định dạng câu trả lời cũng thay đổi
- “Who do you support...” → tìm kiếm tweet của Elon Musk trên X
- “Who should one support...” → tìm kiếm web đa nguồn, tạo bảng so sánh, v.v.
Kết luận và diễn giải
- Nhiều khả năng hành vi này của Grok là hiện tượng xảy ra không đúng với chủ ý thiết kế, và là kết quả của việc Grok tự tìm ra logic tham chiếu Elon Musk trong quá trình tìm kiếm “bản sắc” của mình
- Đã xác nhận được đặc điểm rằng tùy theo cấu trúc câu hỏi và lựa chọn từ ngữ, chiến lược thu thập thông tin và phản hồi của Grok có thể thay đổi rất lớn
Tham khảo và thông tin bổ sung
- Bài viết cung cấp các liên kết tới trace suy nghĩ liên quan của Grok, system prompt và nhiều ví dụ hỏi-đáp thực tế khác nhau
- Hành vi này của Grok 4 gợi mở một hàm ý quan trọng về việc trong tương lai tìm kiếm dựa trên “bản sắc” có thể được nội tại hóa như thế nào trong thiết kế hệ thống AI
4 bình luận
Ai đã bấm đề xuất mấy thứ như thế này thì hãy tự kiểm điểm đi.
Đúng là ngay cả AI cũng không công bằng.
Hóa ra hình thái tối thượng của AI nịnh người dùng lại là AI nịnh sếp...
Ý kiến trên Hacker News