Phân tích thực chứng về cách Google AI Search đọc nội dung

(dejan.ai)

7 điểm bởi davespark 2026-02-25 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Chuyên gia SEO Dan Petrovic (DEJAN) đã phân tích dữ liệu thô từ Google Gemini API và lần đầu tiên làm sáng tỏ bằng thực nghiệm việc Google AI Search (dựa trên Gemini) trích chọn những câu nào từ trang web làm căn cứ trả lời (grounding snippet).

Các điểm phát hiện chính:

Câu hỏi → được phân rã thành nhiều truy vấn con bằng query fanout
Với mỗi truy vấn con, hệ thống chọn 5~20 trang → chấm điểm mức độ liên quan của từng câu với truy vấn
Tiêu chí quan trọng nhất = độ tương đồng ngữ nghĩa của câu (các phần không liên quan đến truy vấn sẽ bị bỏ qua toàn bộ)
Phần mở đầu (đoạn đầu tiên) hầu như luôn được trích xuất ngay cả khi độ liên quan thấp → tồn tại lead bias mạnh
Các yếu tố cấu trúc như mục lục, header, đoạn mã cũng được xử lý như câu văn thông thường và được chấm điểm
Các câu được chọn sẽ được nối bằng … để tạo thành snippet → dùng làm căn cứ trích dẫn khi sinh câu trả lời cuối cùng

Kết luận, Google AI Search không vận hành bằng cách để AI tự do diễn giải mà trải qua quá trình chấm điểm mức độ liên quan chính xác ở cấp câu + chọn lọc.
→ Điều này mang lại insight thực tế rằng cần đặt thông điệp cốt lõi thật mạnh ở phần mở đầu, và từng câu phải gần gũi về ngữ nghĩa với truy vấn thì xác suất được AI trích dẫn trong câu trả lời sẽ cao hơn.

Petrovic cũng đã công bố một công cụ demo mô phỏng cơ chế này.

https://aisparkup.com/posts/9618

Phân tích thực chứng về cách Google AI Search đọc nội dung

Bài viết liên quan

Chưa có bình luận nào.