- Google Search đang chuyển từ cách đưa người dùng tới các liên kết sang mô hình tập trung vào câu trả lời đã được xử lý, qua đó tạo ra một tầng mới có thể kiểm soát bên trên web
- AI Overviews bị phân tích là đưa ra câu trả lời sai trong khoảng 10% trường hợp, và Search đang phần lớn từ bỏ việc cung cấp liên kết tới nguồn thông tin
- Đằng sau lớp vỏ “AI” và “agentic”, cốt lõi là cách phi ngữ cảnh hóa thông tin, loại bỏ nguồn rồi thay thế bằng phản hồi từ LLM
- Website và các tác phẩm sáng tạo đang trở nên gần với nguyên liệu thô không công cho cỗ máy ép văn bản tổng hợp của Google hơn là những sản phẩm văn hóa được chia sẻ
- Cách đối phó là De-googlifying, tránh Chrome, dùng công cụ tìm kiếm thay thế; nếu không, bạn có thể chỉ còn thấy những gì Google cho là có liên quan
Tầng trừu tượng mới mà Google Search đang tạo ra bên trên web
- Bài phát biểu chính tại Google I/O có thể được đọc như một cuộc tấn công vào phần còn lại của web, và mô tả của Google cho thấy hướng đi đẩy Search xa hơn nữa khỏi việc cung cấp liên kết để nghiêng về câu trả lời đã được xử lý
- Hiện tại, AI Overviews — các đoạn AI snippets của Search — bị phân tích là đưa ra câu trả lời sai trong khoảng 10% trường hợp, và Google đang phần lớn từ bỏ mô hình cũ là cung cấp liên kết tới nguồn thông tin
- Đằng sau các lớp vỏ như “AI”, “agentic”, cốt lõi là cách phi ngữ cảnh hóa thông tin, loại bỏ liên kết nguồn rồi đưa ra phản hồi do LLM tạo ra
- Google đang tạo ra một tầng trừu tượng mới có thể kiểm soát bên trên web, theo hướng ẩn website và tác phẩm sáng tạo ra sau bề mặt của Google thay vì để người dùng trực tiếp ghé thăm và chia sẻ chúng
Tác phẩm sáng tạo không còn là sản phẩm văn hóa mà trở thành nguyên liệu thô
- Website, bài viết và nghệ thuật vẫn còn quan trọng ở một mức độ nào đó, nhưng giá trị của chúng ngày càng gần với giá trị như nguyên liệu thô không công cho cỗ máy ép văn bản tổng hợp của Google
- Người sáng tạo làm việc miễn phí, còn Google kiểm soát chặt hơn dòng chảy thông tin và có thể điều chỉnh phản hồi mà mọi người nhận được theo hướng Google mong muốn
- Tác phẩm sáng tạo không còn được ưu tiên như những sản phẩm văn hóa quan trọng có thể chia sẻ với người khác, mà bị đẩy lùi thành đầu vào để Google xử lý và tái tổ hợp
Sự thay đổi đi ngược lại web có tính tham gia
- Sự thay đổi này không được xem là một cuộc cách mạng hướng tới web có tính tham gia, mà là một phản cách mạng chống lại web có tính tham gia và chống lại chính người dùng
- Mục tiêu là chiếm lấy web và dẫn dắt con người vào một tầng trừu tượng bên trên web do Google kiểm soát và điều phối
- Đây là vấn đề độc quyền quyền truy cập thông tin, và được mô tả như một Metaverse thực sự, tách khỏi các tiêu chuẩn mở và khả năng để mỗi người tạo ra một góc web phù hợp với nhu cầu và mong muốn của mình
- Vì ảnh hưởng của Google lên các tiêu chuẩn web rất lớn, hướng đi này có thể thay đổi cả hình thái chuẩn của bối cảnh kỹ thuật dùng để xây dựng web
Khả năng kiểm soát dưới cái tên “web an toàn”
- Ở bước tiếp theo, Google hoặc các công ty khác trong cùng không gian có thể tạo ra và phát tán những thuật ngữ miệt thị mới để gắn cho web truyền thống là bẩn thỉu, không kiểm soát được, nguy hiểm và xấu
- Cách đặt tên này có thể vận hành tương tự “Dark Web”, qua đó khiến bề mặt web đã bị trừu tượng hóa của Google được định vị như web an toàn
Ứng phó: giảm phụ thuộc vào Google
- Nếu coi trọng web và khả năng để con người tham gia vào web thay vì chỉ là những người tiêu thụ thụ động đơn thuần, thì cần nhìn nhận sự thay đổi này một cách nghiêm túc
- Việc loại bỏ Google khỏi bộ máy tinh thần của mình qua De-googlifying trở nên cấp bách hơn
- Bài viết đề xuất tìm công cụ tìm kiếm khác và chọn không dùng trình duyệt Chrome
- Nếu không, bạn có thể tỉnh dậy trong một môi trường giống AOL bị bùn hóa, nơi quyền truy cập thông tin bị giới hạn vào những gì cỗ máy ép văn bản tổng hợp của Google cho là có liên quan
1 bình luận
Ý kiến trên Hacker News
Có cảm giác AI giờ đã đi đến mức “nghệ thuật, code, âm nhạc, viết lách thì vẫn có thể làm để tự thỏa mãn, nhưng không còn kiếm tiền được nữa”
Kiếm tiền từ nội dung giờ chỉ còn khả thi với các tập đoàn lớn, còn nếu công bố thứ gì mang tính sáng tạo thì cuối cùng nó chỉ lại bị ném cho máy nuốt vào và tiếp tục sao chép mà thôi
Có vẻ như thế giới gần như đang tách thành hai “xã hội”: một bên thích AI + tập đoàn lớn + đổi mới cực nhanh và phá hủy mạnh mẽ, bên kia thích công việc thủ công + doanh nghiệp nhỏ + đổi mới chậm hơn nhưng bền vững hơn
Cá nhân tôi muốn sống ở xã hội thứ hai, nhưng tôi nghĩ cả hai vẫn có thể cùng tồn tại và phát triển theo cách riêng của mình
Tất nhiên, những xã hội khác nhau rồi sẽ tương tác và ảnh hưởng lẫn nhau
Tôi từng thấy hiệu ứng tương tự ở ngành khách sạn. Khách sạn, booking.com, và Google đều muốn kiếm tiền, nhưng khách hàng thường chỉ tìm “khách sạn ở đâu đó” trên Google, rồi Google bán quảng cáo cho truy vấn đó để người trả giá cao nhất lấy phần lớn lợi nhuận
Cần đánh thuế lợi nhuận quá mức của các công ty công nghệ tạo ra từ công sức của người khác, rồi dùng số tiền đó để hỗ trợ các nghệ sĩ còn sống
Nó hơi giống kiểu phụ thu từng áp lên băng cassette trắng để bù cho nạn sao chép lậu ngày xưa. Chỉ là tiền phải đến thẳng tay nghệ sĩ thực sự, chứ không phải hãng đĩa hay nhà xuất bản
Với kiểu “khách hàng” đó thì cũng chẳng khác gì đóng khung poster Mona Lisa rồi treo lên
Không hẳn là nghệ sĩ đang bị đe dọa; ngược lại, AI có thể khiến tác phẩm gốc trở nên quý giá và đáng thưởng thức hơn
Để ngăn việc này, khoảng một hai tháng trước tôi đã đưa phần lớn website nghiên cứu Amazon Redshift của mình vào sau lớp xác thực cơ bản bằng tên người dùng/mật khẩu
Mọi thứ vẫn miễn phí, nhưng để lấy tên người dùng và mật khẩu thì phải gửi email cho tôi
Tôi đã bỏ thời gian tạo nội dung, nhưng nếu những công ty như OpenAI sao chép nó rồi bán qua LLM, và kết quả là chẳng còn ai vào trang của tôi nữa, thì tôi không còn lý do gì để tạo nội dung đó cả. Khi ấy OpenAI cũng chẳng còn gì để lấy, người khác cũng chẳng còn gì để đọc, và tất cả đều thiệt
Cách làm này mang tính ký sinh, và bề ngoài giống như đang giết luôn vật chủ. Nó gần như tạo cảm giác xóa bỏ khái niệm tài sản tư hữu
Các công ty AI có thể lấy thứ tôi làm ra mà không cần sự đồng ý của tôi rồi bán nó để kiếm lời, trong khi khoản lời đó dường như vốn dĩ phần lớn phải thuộc về tôi như thành quả lao động của mình
Tôi đã tìm cách đánh dấu để các công ty AI gỡ nội dung của tôi ra, nhưng những cơ chế họ đưa ra chỉ mang tính hình thức và đẩy gánh nặng sang phía tôi. Hơn nữa, tôi cũng không thể biết liệu nó có thật sự bị gỡ hay chưa. Đại loại là “nếu bạn chứng minh nội dung của bạn xuất hiện trong prompt, chúng tôi sẽ cố gắng có biện pháp để nó không xuất hiện nữa”
Kết quả của việc dựng hàng rào tên người dùng/mật khẩu là Google hạ xếp hạng trang của tôi rất mạnh, và giờ gần như không thể tìm ra qua tìm kiếm nữa
Tôi cũng thắc mắc việc bày tỏ ý muốn bị gỡ khỏi các công ty AI có bao gồm cả những nơi có ghi công và gắn link về nguồn gốc ban đầu hay không. Ví dụ Perplexity làm phần đó khá tốt
Nếu bạn chặn truy cập nội dung khi chưa đăng nhập thì cũng đồng nghĩa chặn lập chỉ mục của công cụ tìm kiếm, nên việc Google hạ hạng là điều dễ hiểu
Tôi hơi bối rối về mục tiêu cuối cùng ở đây. Khi đã đăng nội dung miễn phí lên web, tôi không rõ chặn lập chỉ mục AI thì được gì, nhất là khi như vậy còn chặn luôn cả người dùng thật dù là AI hay tìm kiếm truyền thống
Tôi hiểu cảm giác bực bội khi công cụ AI tiêu hóa nội dung của mình rồi lặp lại cho người dùng mà không dẫn họ đến trang gốc. Nhưng kể cả không có AI thì con người vốn vẫn luôn làm thế. Họ đọc bài, học được sự thật hoặc hiểu một ý tưởng mới, rồi hòa nó vào công việc của mình mà không nhất thiết phải ghi nhận hay nhớ nguồn thông tin đó
AI chỉ khiến quá trình ấy diễn ra nhanh hơn và dễ thấy hơn nên tôi hiểu vì sao nó gây bực bội, nhưng ngay từ đầu có lẽ kỳ vọng rằng mọi thứ diễn ra ở hạ lưu của công việc mình đều phải được quy về cho mình vốn đã không thật sự hợp lý
Như bạn nói, họ cũng biết mình cần dữ liệu tốt, nên trên thực tế họ có thể sẽ cố tìm một điểm cân bằng nào đó
Nếu không, các phòng lab AI có khi sẽ tự tạo ra nội dung mới có giá trị để nuôi LLM. Nghe điên rồ thật, nhưng Netflix cũng tự sản xuất nội dung mà
Có vẻ các phòng lab AI sẽ trở nên quá lớn đến mức đảm nhận vai trò vượt xa chuyện chỉ cung cấp suy luận LLM. Họ có thể mạnh ngang, thậm chí mạnh hơn nhiều chính phủ quốc gia hiện nay
Tôi thấy khó hiểu được cục diện cuối cùng ở đây. Các website đã cho Google crawl nội dung để đổi lấy lưu lượng truy cập
Nếu Google cắt đứt điều đó hoàn toàn, tôi không hiểu còn động lực gì để các website không chặn Google crawler nữa
Tôi hiểu cảm giác bị đe dọa hiện sinh từ các sản phẩm AI khác nơi Google trực tiếp trả lời, nhưng Google cũng phải hiểu mối quan hệ cộng sinh với web
Tại sao phải mua sắm trên một website ngẫu nhiên nào đó khi Gemini có thể mua giúp bạn? Tại sao phải vào Wikipedia để tìm thông tin… bạn hiểu ý tôi mà
Vài năm tới có vẻ sẽ mang tính quyết định với web. Facebook cũng từng thử chiến lược tương tự khi app lên ngôi, nhưng cuối cùng thất bại. Hy vọng Google cũng thất bại
Nếu website không còn được đăng lên hoặc không còn bị crawl nữa, thì máy móc sẽ tiếp tục lấy gì để ăn và vận hành?
Nên trong đầu họ chẳng có gì thay đổi, chỉ là độc giả giờ không phải con người mà là bot. Với người viết thì điều này kinh khủng
Từ lâu chúng ta đã giao việc đưa lưu lượng truy cập đến website cho Google
Chủ yếu vì Google làm quá tốt nên các lựa chọn thay thế trở nên kém hữu ích hơn hẳn
Giờ Google đang tập trung vào việc, nói nôm na, trở thành “một hệ khép kín”, nên chúng ta cần tìm cách tốt hơn để đưa traffic đến website. Lý tưởng nhất là cách đó không nằm dưới sự kiểm soát của một công ty duy nhất
Có ai nhớ StumbleUpon không?
Dù xét bản chất vấn đề thì điều đó có lẽ dễ hiểu, nhưng ngày xưa cũng từng có không ít ý tưởng phi tập trung hoàn toàn vô lý và không phù hợp mà
Những website tổng hợp link được tổ chức tốt hữu ích hơn nhiều trong việc tìm ra website mới
Là người vận hành website, tôi tận mắt thấy lượt xem tăng mạnh, nhưng khi thấy tóm tắt AI sai mà lại gắn website của tôi làm nguồn thì đúng là cú đánh đau
Xu hướng nhồi AI vào mọi thứ cuối cùng có vẻ sẽ làm thế giới bớt thành thạo hơn, và tôi lo vì trông không có cách nào ngăn lại
Hôm nay tôi hỏi một lập trình viên xem sản phẩm của chúng tôi được lập trình để xử lý tình huống nào đó ra sao, thì anh ta chỉ gửi cho tôi bản tóm tắt từ trợ lý AI nội bộ mà anh ấy mới bắt đầu dùng
Trước đây anh ấy luôn đưa ra câu trả lời thật sự hay và có suy nghĩ, còn giờ chỉ là copy/paste câu trả lời AI
Có vẻ họ phản đối việc người khác scrape chính họ: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...
Có lẽ tôi sẽ buồn hơn nếu web ngay từ đầu không mục ruỗng như thế này
Trung bình mà nói, vào một site bất kỳ thì chỉ thấy nó quăng quảng cáo vào mặt và quấy rầy bắt đăng ký thôi
Tôi không hiểu vì sao mấy modal đó lại không bị tính là popup
Cấu trúc khuyến khích của công cụ tìm kiếm thiên về nội dung mới hơn là nội dung tốt, khiến mọi website cứ liên tục tuôn ra những thứ như rác được tạo hàng loạt
Bây giờ hễ kết quả tìm kiếm có dấu thời gian trong vòng 2 năm gần đây là tôi mặc định xem như rác và không bấm vào
Có lẽ câu trả lời là chuyển sang Kagi. Ở đó tôi là khách hàng chứ không phải sản phẩm
Nói thật không phải mọi website đều như vậy, vẫn còn những nơi tốt. Nhưng công cụ tìm kiếm thì chẳng bao giờ dẫn bạn đến đó. Nó chỉ ném rác vào mặt bạn cả ngày
Dù nếu Google không làm thì có thể ai đó khác cũng sẽ làm, nhưng thực tế là Google đã làm, và họ đã đầu độc cái giếng mà tất cả chúng ta cùng uống
Đi được khoảng nửa bài thì có 3 banner quảng cáo khổng lồ chiếm phía trên, bên phải và phía dưới, ngốn nhiều diện tích hơn cả phần nội dung, còn góc dưới bên phải có một quảng cáo video tự phát nổi lềnh bềnh che mất phần lớn một banner khác
Quảng cáo “động” chen giữa bài thì cứ phình ra co lại đột ngột làm mọi thứ giật lag đến mức thực sự không thể đọc được gì
Mà đây còn là một trong những trải nghiệm tương đối dễ chịu hơn khi đọc thứ gì đó kiểu blog hiện đại. Nó gần như đã tiệm cận mức của mấy trang phim sex mờ ám
Thật buồn và thảm hại
Nhiều tuyên bố kiểu này với tôi không thật sự có ý nghĩa, vì nó không khớp với mô hình vấn đề mà tôi nhìn thấy
Tôi vừa là người viết blog, tức theo cách gọi hiện nay là “nhà sản xuất nội dung”, vừa là người dùng
Với tư cách người dùng, tôi muốn user agent của trình duyệt thay tôi hiển thị trang web, và muốn tác nhân tìm kiếm trích xuất thông tin từ nhiều nguồn rồi tổng hợp lại kèm ghi nguồn phù hợp
Có thể phản biện rằng tôi thờ ơ với việc bị nền tảng trung gian hóa vì việc sản xuất nội dung của tôi chỉ là sở thích. Điều đó đúng phần nào. Nếu tôi sống bằng nghề này, tôi có thể kết luận rằng hành vi làm tổn hại sinh kế của mình là “chiến tranh” chống lại web
Tuy nhiên, một quan sát viên trung lập thì nên xem rằng nếu đây là chiến tranh, thì đó là chiến tranh chống lại cách tôi tham gia web với mục tiêu sáng tạo nội dung vì doanh thu, danh tiếng và phần thưởng
Với tư cách người dùng, thực ra tôi không quá quan tâm đến từng website hay từng người tạo ra nó. Thông tin bên trong thì hữu ích, nhưng tính dị biệt giữa các site phần lớn chỉ là vật cản cho việc tiếp cận thông tin
Nếu các tác nhân tìm kiếm và tóm tắt có thể tổng hợp chính xác điều mà các website này nói, giúp mô hình về thực tại trong đầu tôi chính xác hơn, thì tôi sẽ hài lòng hơn nhiều
Vì vậy, tôi có thể bị thuyết phục bởi lập luận rằng thay đổi của Google sẽ làm giảm khả năng nội dung chính xác được tạo ra, và khiến tôi bị dẫn sai thường xuyên hơn. Nhưng đây là công cụ, và mô hình thế giới của tôi sẽ còn thường xuyên được thực tại kiểm chứng
Nếu cỗ máy tìm kiếm/tổng hợp không cho ra kết quả hữu ích thì tôi sẽ nhận ra, và phải điều chỉnh cách mình đối xử với kiến thức đó để tránh hậu quả chết người. Nhưng thật ra ngay bây giờ cũng vậy
Tôi không thể biết kết quả tìm kiếm Google có phải là những kết quả được cài cắm nhằm điều chỉnh quan điểm của tôi hay không, và cũng không thể biết Google có đang cấu kết với Internet Archive để khiến một sự đồng thuận do họ dựng lên trông như thật hay không
Là người dùng, tôi vốn đã phải tự đưa ra rất nhiều quyết định, và việc chật vật đọc kết quả tìm kiếm rồi tự tổng hợp lấy còn kém hữu ích hơn nhiều so với dùng tác nhân
Vì thế, nếu có một cuộc chiến chống lại web, tôi sẵn sàng tham gia. Về phía chống lại web
Nó giống như tóm tắt cốt truyện có thể giúp quyết định có xem một bộ phim hay không, nhưng không phải là thứ thay thế cho việc thực sự xem phim
Với các truy vấn như “50 usd in eur” hay “current weather in Paris” thì AI trả lời là ổn. Phức tạp hơn thế thì tôi thích có link đến nguồn thực tế hơn nhiều
Phần lạc quan là điều này trông giống một bước đẩy mạnh hơn nữa theo đúng hướng mà “web” đã đi từ lâu: hướng cản trở người dùng lấy được thông tin đúng một cách trung thực và hiệu quả, đồng thời bảo toàn ngân sách chú ý và quyền lựa chọn của họ
Cho đến nay, cách làm là tăng nhiễu vì động cơ tiền bạc; còn bây giờ là cắt bỏ nhiễu cũng vì động cơ tiền bạc
Lý do để lạc quan là trước đây không có một kẻ thù đơn lẻ nào nên rất khó chống lại một hệ thống phần nào phân tán, còn bây giờ Google đang đẩy mọi thứ tệ hơn và biến chính họ cùng một vài công ty khác thành mục tiêu rất rõ ràng
Hy vọng điều này sẽ khiến nhiều người vượt quá giới hạn chịu đựng, để rồi tìm cách quay lại kiểu “web cũ” trước khi Google và các mạng quảng cáo làm biến dạng nó, hoặc tìm ra những cách mới để tiếp cận nhau và nội dung một cách tự do hơn
Đây sẽ không phải cuộc chiến nhỏ hay dễ dàng. Phần lớn nó là cuộc chiến chống lại trạng thái hiện tại của chủ nghĩa tư bản, và để giành lại sự chú ý, tư duy phản biện và quyền lựa chọn của chúng ta
Họ phải trả tiền cho những chủ sở hữu website mà họ đang dùng dữ liệu
Giờ tôi cũng không chắc đây có còn là điều xấu hay không
Web đang ngập rác SEO đến mức có khi việc Google rút đi và tạo ra một đợt thanh lọc kiểu Usenet lại là điều cần thiết
Tính năng AI thường cho tôi biết ngay điều mình muốn, và nếu muốn kiểm chứng thì thường cũng có link nguồn kèm theo. Kiểu link truyền thống vẫn hoạt động
Những người nói là không dùng được thường không đưa ra được ví dụ cụ thể mà họ thật sự không tìm thấy
Tôi cũng thấy vài mảng yếu. Tài liệu cũ và mơ hồ thì có vẻ công cụ tìm kiếm nào cũng chạm giới hạn, còn tài liệu liên quan đến sao chép lậu thì cứ dùng Yandex là được