1 điểm bởi GN⁺ 1 giờ trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Kết quả tìm kiếm không còn chỉ là danh sách liên kết mà đang chuyển thành các trang nguồn để AI đọc thay người dùng, và AI Overviews, ChatGPT, Claude, Perplexity, Gemini đều tham chiếu trang web theo thời gian thực
  • AEO (Answer Engine Optimization) là công việc để trở thành nguồn được trích dẫn khi công cụ trả lời đưa ra câu trả lời trực tiếp, còn GEO (Generative Engine Optimization) là công việc để xuất hiện trong câu trả lời do AI tạo sinh viết ra
  • Trong hướng dẫn tối ưu hóa AI của mình, Google định nghĩa hai khái niệm này là biến thể của SEO truyền thống, và nêu rõ cùng một hệ thống xếp hạng và chất lượng quyết định cả tìm kiếm thông thường lẫn AI Overview
  • Điều kiện tiên quyết để xuất hiện trong các tính năng AI là đủ điều kiện hiển thị snippet trên tìm kiếm thông thường; việc xử lý các vấn đề chặn crawl, render, index phải được ưu tiên trước tối ưu nội dung
  • Những trang được trích dẫn là các trang chứa số liệu cụ thể, trải nghiệm riêng, chi tiết độc đáo mà mô hình không thể viết chỉ bằng dữ liệu huấn luyện; AEO/GEO không phải một ngành tách biệt khỏi SEO mà là phần nối dài của cùng một công việc

Định nghĩa và vị trí của AEO và GEO

  • Khác với 2 năm trước, Google mở kết quả tìm kiếm bằng AI Overviews, ChatGPT và Claude kéo kết quả web thời gian thực vào câu trả lời, Perplexity xây dựng sản phẩm theo chính cách này, còn Gemini có thể được truy cập chỉ với một lần chạm trên mọi bề mặt của Google
  • Trang không còn là đích đến mà là nguồn để mô hình đọc thay người dùng
  • AEO (Answer Engine Optimization): công việc để trở thành nguồn được dùng khi công cụ trả lời đưa ra câu trả lời trực tiếp thay vì danh sách liên kết
  • GEO (Generative Engine Optimization): công việc để xuất hiện trong câu trả lời do AI tạo sinh tham chiếu trang rồi viết lại từ đầu
  • Hướng dẫn tối ưu AI của Google quy định rằng “tối ưu hóa cho tìm kiếm AI tạo sinh là tối ưu hóa cho trải nghiệm tìm kiếm, vì vậy vẫn là SEO”
    • Hệ thống xếp hạng và chất lượng quyết định danh sách liên kết màu xanh cũng chính là hệ thống quyết định việc xuất hiện trong AI Overview
    • Cải thiện một bên thì bên còn lại cũng được cải thiện theo
  • Mỗi bề mặt AI dùng chỉ mục web khác nhau, nhưng phần lớn các chỉ mục đó là sản phẩm phụ của cùng công việc crawl, render và chất lượng

Điều kiện đủ tư cách là thứ đứng trước mọi thứ khác

  • Để một trang xuất hiện trong các tính năng AI, trước hết nó phải đủ điều kiện xuất hiện dưới dạng snippet trên tìm kiếm thông thường
    • URL phải được index
    • Phải cho phép crawl trong robots.txt
    • Phải cho phép snippet (nosnippet, max-snippet:0 không được có)
    • Nội dung phải tải được mà không cần thực thi JavaScript nặng
  • Trong phần kiểm tra URL của Google Search Console, cần dùng “Test live URL” để kiểm tra HTML đã render
    • Nếu phần thân bài bị thiếu trong HTML đã render thì phải sửa việc đó trước mọi việc khác
    • Render phía máy chủ và tạo tĩnh là cách an toàn nhất
  • Bài kiểm tra curl trên terminal có thể dùng như công cụ kiểm tra 30 giây, nhưng 200 OK giả lập UA không phải bằng chứng cho thấy crawler thực sự truy cập được
    • Các đơn vị vận hành bot chặn việc giả mạo UA
    • Cách xác minh có thẩm quyền là kiểm tra dải IP đã công bố hoặc bản ghi reverse-DNS
    • Google, OpenAI, Anthropic, Perplexity đều công bố dải IP trong tài liệu bot của họ

Phân biệt crawler huấn luyện và crawler tìm kiếm

  • GPTBot, ClaudeBot: là crawler dùng cho huấn luyện; chặn chúng không ảnh hưởng đến khả năng hiển thị trên tìm kiếm
  • Google-Extended: kiểm soát việc huấn luyện AI + grounding trong Gemini Apps và Vertex AI Grounding, không ảnh hưởng đến thứ hạng Google Search hay điều kiện đủ tư cách cho AI Overview
  • Các indexer tìm kiếm quyết định việc xuất hiện trong câu trả lời AI:
    • Googlebot, Bingbot, OAI-SearchBot, Claude-SearchBot, PerplexityBot
  • Nhiều website vô tình chặn một trong số này và làm giảm khả năng hiển thị
  • Có thể cấu hình robots.txt để cho phép hiển thị trên tìm kiếm AI trong khi vẫn chặn bot huấn luyện
  • Thẻ meta robots là công cụ kiểm soát ở cấp trang, không phải cấp toàn site
  • Opt-out Google-Extended chỉ có thể thực hiện bằng token trong robots.txt; không có tài liệu cho meta tag
  • Mọi lớp đều là cổng chặn, và mọi cổng phải mở thì công việc tối ưu phía sau mới có ý nghĩa

Nội dung được trích dẫn là thứ mô hình không thể viết chỉ bằng dữ liệu huấn luyện

  • Tìm kiếm tạo sinh thưởng cho tính cụ thể
    • Thông tin chung chung có thể được mô hình tóm tắt mà không cần trích dẫn
    • Những trang được trích dẫn là những trang chứa nội dung mà mô hình không thể tự tổng hợp ra
  • Hướng dẫn của Google nhấn mạnh việc tạo “nội dung độc đáo, có giá trị và lấy con người làm trung tâm”, tránh nội dung hàng hóa mà trang nào khác cũng nói như nhau
  • Hướng dẫn Helpful content nói về cách thể hiện trải nghiệm trực tiếp, chuyên môn thực tế, góc nhìn riêng
  • So sánh ví dụ bài viết migration Next.js 16
    • Bản commodity: mô hình có thể tạo chỉ bằng dữ liệu huấn luyện → không được trích dẫn
    • Bản distinctive: có số liệu 47 trang bị lỗi, một bẫy cụ thể trong function signature, và ước tính thời gian 3 giờ
    • Chỉ một chi tiết như vậy cũng đủ để biến trang từ kiểu “tóm tắt dữ liệu huấn luyện” thành trang “tham chiếu được trích dẫn”

Cấu trúc kỹ thuật sạch giúp cả crawler lẫn mô hình

  • Bắt buộc phải dùng Semantic HTML
    • Dùng đúng cấp heading theo hệ thống phân cấp có ý nghĩa
    • Đặt câu trả lời cho chủ đề của trang ở gần phía trên
    • Đừng chôn nội dung bên dưới phần mở đầu
  • Phiên bản được cải thiện cung cấp cấu trúc rõ ràng như article, h1, section, h2
    • Nó cung cấp cấu trúc cho crawler, đồng thời cho mô hình ranh giới rõ ràng giữa heading, lede và body
  • Core Web Vitals được phản ánh vào xếp hạng, và xếp hạng lại phản ánh trực tiếp vào điều kiện đủ tư cách của tính năng AI
    • Các chỉ số mà thuật toán xếp hạng nhìn vào là dữ liệu thực địa 28 ngày từ người dùng Chrome thực tế (CrUX), không phải kết quả Lighthouse cục bộ
    • Có thể dùng web-vitals của JavaScript để căn chỉnh giữa kiểm thử cục bộ và dữ liệu phía hệ thống Google

Những “mẹo tối ưu” mà hướng dẫn bác bỏ

  • Thêm file llms.txt không phải tín hiệu xếp hạng và các tính năng AI của Google không sử dụng nó
  • Không cần chia nội dung thành các chunk nhỏ hoặc biến mọi heading thành câu hỏi (mô hình đọc ngữ cảnh của toàn bộ trang)
  • Dữ liệu có cấu trúc hữu ích khi hỗ trợ các rich result đã được tài liệu hóa, nhưng không bắt buộc để xuất hiện trong tính năng AI
  • Hãy đầu tư thời gian đó vào chất lượng nội dung thực tế và khả năng render

Hình ảnh, schema và dữ liệu thương mại là pipeline có cấu trúc

  • AI Overviews trực tiếp lấy hình ảnh và video chất lượng cao
    • Ảnh chụp màn hình thật, sơ đồ thật, video hướng dẫn ngắn hữu ích hơn ảnh stock
    • Áp dụng các nguyên tắc SEO hình ảnh cơ bản: alt mô tả rõ, tên file có ý nghĩa, chú thích hữu ích
  • Ví dụ so sánh alt text (bài viết về hiệu năng Next.js)
    • Lý do phiên bản thứ hai được kéo vào carousel hình ảnh của AI Overview là vì nó đủ mô tả để mô hình hiểu hình ảnh đang chứng minh điều gì
  • Dữ liệu có cấu trúc đáng để bổ sung khi nó hỗ trợ một rich result cụ thể
    • Schema Recipe, Product, FAQ, Event, Article đều có hiệu quả đã được tài liệu hóa trong tìm kiếm thông thường
    • Chúng được đưa vào cùng một lớp hiểu nội dung mà tính năng AI sử dụng
    • Trước khi triển khai, hãy dùng Rich Results Test để kiểm tra trường bắt buộc bị thiếu hoặc lỗi

Các bề mặt cốt lõi cho doanh nghiệp địa phương và thương mại

  • Google Business Profile: hồ sơ đã xác minh cung cấp giờ mở cửa, vị trí, dịch vụ, đánh giá cho câu trả lời AI địa phương
  • Merchant Center: feed là nguồn thông tin sản phẩm cho AI Overviews
  • Hướng dẫn tối ưu AI nêu rõ hai yếu tố này là đầu vào chính cho kết quả doanh nghiệp và thương mại

Trải nghiệm agent là bề mặt tiếp theo

  • Kỷ nguyên các agent tự chủ duyệt web thay người dùng
    • Claude with computer use, ChatGPT Operator, assistant của Perplexity
  • Hướng dẫn tối ưu AI của Google khuyến nghị cân nhắc cách agent diễn giải DOM, control và nội dung
  • Những website có markup rối rắm, control ẩn hoặc thông tin cốt lõi chỉ render dưới dạng hình ảnh thì agent rất khó xử lý
  • Công việc accessibility cho screen reader phần lớn bao phủ chính khu vực này
  • Ví dụ before/after về control tương tác trên trang đặt chỗ
    • Phiên bản cải thiện truyền đạt cho agent ba điều: đây là nút gửi, hành động là “Confirm booking”, và icon chỉ mang tính trang trí
    • Nếu agent không thể xác định nút xác nhận đặt chỗ, nó sẽ bỏ cuộc và chuyển sang site khác
  • Trường form cũng theo cùng nguyên tắc: agent đọc name, id, aria-label, và phần tử <label> xung quanh
  • Chuyển sang type="datetime-local" là thay đổi nhỏ nhưng cung cấp cho cả trình duyệt lẫn agent datetime picker gốc và cách xử lý giá trị có cấu trúc
    • Agent không cần đoán định dạng

Hãy đo thứ có thể đo, đừng chạy theo thứ không thể

  • Search Console vẫn là nguồn dữ liệu sự thật từ phía Google
    • Lưu lượng từ AI Overviews và AI Mode được tích hợp vào báo cáo Web performance tiêu chuẩn
    • impressions và clicks là các chỉ số cần theo dõi
  • Bing Webmaster Tools cung cấp công cụ tương đương cho Bing và Copilot
  • Một suy luận có thể rút ra một cách thận trọng: lọc Performance theo các truy vấn có từ mở đầu hội thoại như how, what, why, is, can
    • Đây là loại truy vấn long-tail dễ kích hoạt AI Overviews
    • Biến động đáng chú ý giữa impressions và clicks ở các truy vấn này phù hợp với khả năng trang đang bị tóm tắt trong câu trả lời AI thay vì được truy cập trực tiếp
    • Tuy nhiên, nên xem đây là giả thuyết chứ không phải bằng chứng (thay đổi layout, biến động thứ hạng, thay đổi hỗn hợp truy vấn, tính mùa vụ cũng có thể tạo ra mẫu tương tự)
  • Cách kiểm tra trực tiếp việc có được mô hình trích dẫn hay không
    • Mở từng bề mặt và nhập câu hỏi mà nội dung cần trả lời
    • Nếu domain xuất hiện trong danh sách nguồn inline hoặc trích dẫn của câu trả lời thì nghĩa là đang được tìm thấy
    • Lặp lại vài tuần một lần với các chủ đề liên quan đến doanh nghiệp trên các bề mặt chính
    • Theo dõi số lượng cite-event như theo dõi backlink

Kết luận: AEO và GEO không phải lĩnh vực tách biệt khỏi SEO

  • Các công việc ở trên bao phủ những gì hướng dẫn tối ưu AI của Google khuyến nghị và những gì các bề mặt tìm kiếm AI khác tưởng thưởng
  • AEO và GEO không phải lĩnh vực riêng tách khỏi SEO, mà là cùng một công việc với sự chú ý sắc nét hơn vào tính độc đáo của nội dung, khả năng render và các pipeline có cấu trúc cấp dữ liệu cho mọi bề mặt AI

Chưa có bình luận nào.

Chưa có bình luận nào.