1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Mô hình tài trợ web bằng quảng cáonhắm mục tiêu dựa trên theo dõi bị trói vào nhau thành một chuỗi logic, khiến việc theo dõi chéo giữa các website không còn là lựa chọn riêng mà trở thành tiền đề mặc định
  • DoubleClick DARTthird-party cookie đã cho phép theo dõi cùng một người dùng trên nhiều website, và hạ tầng đó vẫn được duy trì về sau
  • 10.000 website hàng đầu tải trung bình 7 third-party tracker mỗi trang, 41,1% lưu lượng đi kèm tracker, và mỗi tracker bổ sung làm thời gian tải trang tăng khoảng 2,5%
  • Ngành công nghiệp banner cookie cũng đã trở thành một thị trường riêng; khi nút "Reject all" bị ẩn đi, tối đa 90% người dùng sẽ chấp nhận, tạo ra phản ứng gần với sự mệt mỏi hơn là đồng thuận
  • Apple ATT chỉ với một yêu cầu cho phép ở cấp hệ điều hành đã hạ tỷ lệ opt-in xuống 15~25% và để lại ước tính thiệt hại khoảng 10 tỷ USD đối với doanh thu năm 2022 của Meta, cho thấy việc bật theo dõi theo mặc định không phải tất yếu kỹ thuật mà là một lựa chọn

Tiên đề

  • Cấu trúc hiện tại được biện minh bằng chuỗi logic rằng quảng cáo tài trợ cho web, và theo dõi làm cho quảng cáo khả thi, nên theo dõi là cần thiết
    • Banner cookie được đối xử như một loại biên nhận hiện đại, và cú nhấp vào "Accept" được xem là đồng ý
    • Cấu trúc này trông như một logic gọn gàng, nhưng bản thân tiền đề lại là thứ cần được xem xét riêng
  • Không ai từng bỏ phiếu cho cấu trúc này, nhưng nó đã tự ổn định thành mặc định
    • Khi FTC và EU còn đang kết thúc tranh luận xoay quanh cạnh tranh thị trường, cấu trúc của web đã lặng lẽ biến thành một hệ thống giám sát

Nguồn gốc

  • DoubleClick được thành lập tại New York năm 1996, và sản phẩm DART hoạt động dựa trên tiền đề theo chân người dùng giữa các website để phân phối quảng cáo phù hợp
    • DART là viết tắt của Dynamic Advertising, Reporting, and Targeting
    • Ý tưởng cốt lõi là nhà quảng cáo phải có khả năng theo dõi cùng một cá nhân trên nhiều website
  • Đổi mới kỹ thuật then chốt là third-party cookie, một tệp văn bản nhỏ do máy chủ mà người dùng chưa từng truy cập cài xuống, rồi theo chân họ qua mọi website có tải pixel đó
    • Bản thân cơ chế kỹ thuật thì bình thường, nhưng hệ quả cấu trúc thì không hề bình thường
    • Vào thời điểm banner quảng cáo đã tồn tại, nền tảng theo dõi chéo giữa các website vượt qua kiểu hiển thị ngẫu nhiên đã được hình thành
  • Sau thương vụ mua lại Abacus Direct năm 1999, đề xuất kết hợp hai cơ sở dữ liệu đã được đưa ra, và FTC của Mỹ bắt đầu điều tra
    • DoubleClick đã lùi bước, nhưng rồi Google vẫn mua lại công ty này vào năm 2007 với giá 3,1 tỷ USD
    • Cuộc điều tra đã thành chuyện cũ, nhưng hạ tầng được xây dựng thì còn lại
  • Con đường sau đó của các nhà sáng lập cũng tiếp tục kéo dài ảnh hưởng này
    • Kevin O'Connor rời DoubleClick năm 2001 và điều hành ScOp Venture Capital, đầu tư vào các công ty công nghệ thế hệ tiếp theo
    • Dwight Merriman sau 10 năm làm CTO của DoubleClick đã đồng sáng lập MongoDB vào năm 2007 cùng một cựu DoubleClick khác là Eliot Horowitz
    • Có thể nói chính đội ngũ từng xây dựng đường ống giám sát chéo giữa các website cũng đã xây dựng cơ sở dữ liệu tài liệu đang vận hành một phần lớn web hiện đại
    • DoubleClick alumni network được mô tả như một cộng đồng nhân tài hải ngoại cực kỳ quan trọng trong ngành công nghệ cùng thời

Mô hình đã tồn tại từ trước DoubleClick

  • Prodigy là một dịch vụ trực tuyến hoạt động từ năm 1984 đến 2001, và đã triển khai một phiên bản sớm của cùng logic này
    • Để giảm chi phí mạng và máy chủ, dịch vụ này chọn cách lưu đệm dữ liệu trên hoặc gần máy tính cá nhân của người dùng
    • Lý do chính đáng được đưa ra là giảm chi phí hạ tầng, còn hệ quả phụ là tích lũy dữ liệu hành vi với quy mô lớn
  • Mô hình này còn lâu đời hơn cả web, và cũng lâu đời hơn third-party cookie
    • Điểm mấu chốt là quan sát rằng dữ liệu người dùng được thu thập vì mục đích vận hành rốt cuộc sẽ trở thành một tài sản hấp dẫn về mặt thương mại
  • Những đường dẫn dữ liệu được thiết kế để tối ưu chi phí cuối cùng lại bị tái sử dụng cho khai thác giá trị
    • Câu hỏi còn lại không phải là nó bắt đầu từ khi nào, mà là vì sao không có tầng giao thức nào ngăn điều đó lại

Chi phí

  • Một website trung bình hiện nay tải 7 third-party tracker mỗi trang, theo số liệu từ 10.000 website hàng đầu
    • 10.000 website hàng đầu này được xem là nhóm tương đối đứng đắn hơn trên Internet
    • 41,1% lưu lượng của các website đó đi kèm tracker
  • Bản thân quy trình xin đồng ý cũng đã trở thành một ngành riêng
    • 67% banner cookie được cung cấp bởi các Consent Management Platform
    • Ba công ty chiếm 37% thị trường đó
    • Chỉ 15% website đạt mức tuân thủ GDPR tối thiểu
  • Khi nút "Reject all" bị giấu đi để phải bấm nhiều lần mới thấy, tối đa 90% người dùng sẽ chấp nhận
    • Điều này được xem không phải là đồng thuận mà là sự mệt mỏi
  • Chi phí vật lý cũng rất rõ ràng
    • Mỗi tracker bổ sung làm thời gian tải trang tăng khoảng 2,5%
    • Những website nhiều tracker chạy chậm hơn khoảng 10 lần so với khi xem cùng trang đó trong trạng thái chặn theo dõi
  • Real-time bidding xử lý khoảng 600 tỷ yêu cầu mỗi ngày, tương đương khoảng 6,9 triệu yêu cầu mỗi giây
    • Mọi banner, hộp thoại và yêu cầu ngầm đều tiêu tốn băng thông, pin, điện năng
    • Hóa đơn được tất cả mọi người cùng trả, nhưng không ai được thấy nó được liệt kê theo từng mục

Bằng chứng

  • Trọng tâm của vấn đề không nằm ở hai nhà sáng lập như cá nhân, mà ở phản ứng logic trước áp lực thương mại
    • Các mạng quảng cáo muốn mở rộng độ phủ, nhà xuất bản muốn doanh thu, và third-party cookie đã đáp ứng được cả hai nhu cầu đó
    • Từ đó dẫn tới câu hỏi không phải là đổ lỗi cho cá nhân, mà là vì sao trình duyệt lại hỗ trợ điều này
  • Câu hỏi sâu hơn nằm ở lựa chọn mang tính cấu trúc
    • Trình duyệt được thiết kế để tải nội dung, nhưng cũng có thể đã được thiết kế để bảo vệ người dùng khỏi bị bám theo
    • Chúng cũng có thể đã được thiết kế để bảo vệ khỏi nền kinh tế lừa đảo vùng xám phát triển trên cùng quỹ đạo đó
  • Apple ATT được nêu ra như một ví dụ thực tế chứng minh rằng lựa chọn khác là có thể
    • Được giới thiệu trên iOS 14.5 vào tháng 4 năm 2021
    • Chỉ bằng một lời nhắc ở cấp hệ điều hành hỏi liệu ứng dụng có được phép theo dõi người dùng qua các ứng dụng và website khác hay không
    • Khi thật sự hỏi, tỷ lệ opt-in chỉ dừng ở mức 15~25%
    • CFO của MetaDavid Wehner ước tính thiệt hại doanh thu năm 2022 vào khoảng 10 tỷ USD
  • Điều cần thiết về mặt kỹ thuật vốn dĩ đã có từ đầu, và bài viết nhấn mạnh rằng theo dõi được bật theo mặc định là một lựa chọn do các nhà cung cấp trình duyệt đưa ra

Câu hỏi

  • Bài viết đặt ra câu hỏi rằng đã có thể có một kết quả khác nếu trình duyệt xử lý dữ liệu cá nhân theo cách mà hệ điều hành xử lý binary chưa được ký, tức là chặn cho tới khi có cho phép rõ ràng
    • Điều gì sẽ xảy ra nếu bản thân giao thức được thiết kế để bảo vệ người dùng thay vì nhà quảng cáo
    • Điều gì sẽ xảy ra nếu các yêu cầu chéo website bị đối xử một cách hoài nghi, như khi một người lạ trên tàu nhờ bạn giữ giúp một bưu kiện
  • Sau 30 năm, câu hỏi này vẫn chưa có lời đáp
    • Hạ tầng tồn tại vì một khi đã được xây xong thì nó tiếp tục tồn tại, và vì việc đảo ngược nó gây bất tiện cho các tổ chức đã tạo ra nó
  • Việc chỉ một lời nhắc của Apple đã làm dịch chuyển 10 tỷ USD trong vòng một năm được đưa ra như một mốc tham chiếu
    • Nếu là mười hai lời nhắc thì điều gì đã dịch chuyển
    • Nếu ngay từ năm 1996 third-party cookie chưa từng được phát hành thì điều gì đã khác đi
  • Thay cho một kết luận chắc chắn, điều còn lại chỉ là việc không ai từng được hỏi

1 bình luận

 
Ý kiến Hacker News
  • Cảm giác của tôi là quảng cáo cá nhân hóa có vẻ ảo hơn người ta tưởng. Dù có những bằng chứng như doanh thu Meta bị ảnh hưởng sau Apple ATT, nhưng khoảng 30% quảng cáo tôi thấy trên Facebook và YouTube trông như quảng cáo lừa đảo trắng trợn mà ngay cả khi không cần profiling vẫn có thể phát tán được. Ví dụ, tôi đã thấy suốt cả tuần một quảng cáo bắt chước thông báo Facebook, và khi bấm vào thì hiện ra trang dọa rằng tôi đã bị hack. Tôi còn báo cáo nó, nhưng nó vẫn sống rất lâu, điều đó thật kỳ lạ. Còn những quảng cáo thực sự phù hợp với tôi thì hầu như không có, chỉ toàn retargeting những món tôi đã mua rồi, khiến tôi tự hỏi liệu mình có phải là kiểu người dùng quá mức không có giá trị thương mại hay không

    • Tôi không nghĩ việc một vài người nhận quảng cáo vớ vẩn là bằng chứng cho thấy hệ thống giám sát không hoạt động. Điểm mấu chốt là các chiến dịch nhắm mục tiêu chính xác thu hút được bao nhiêu tiền. Bản thân quảng cáo có thể tương đối vô hại, nhưng nếu cùng dữ liệu đó rơi vào tay các tác nhân nhà nước thì nó trở nên quan trọng hơn nhiều như một công cụ đàn áp công dân. Nó có thể được dùng để quyết định vẽ khu bầu cử như thế nào, đặt cơ sở gây tranh cãi hay thư viện ở đâu, tìm ai để trục xuất, hoặc tác động đến ai bằng cách nào trong các chiến dịch chính trị. Dù có sai số đôi chút, nó vẫn đủ hữu ích để giảm đáng kể khối lượng sàng lọc thủ công
    • Tôi cũng hiểu là mình chặn khá nhiều theo dõi web nên các nhà quảng cáo khó nhắm mục tiêu tôi. Nhưng ngay cả thông tin mà họ lẽ ra dùng được, họ dường như cũng không tận dụng nổi. Theo trải nghiệm của tôi, các công ty quảng cáo nhắm mục tiêu cực tệ. Trên YouTube, tôi liên tục thấy quảng cáo bằng tiếng Thổ Nhĩ Kỳ, tiếng Việt, tiếng Ả Rập, tiếng Nhật, tiếng Trung mà tôi hoàn toàn không hiểu. Cài đặt ngôn ngữ tài khoản Google, trình duyệt và thiết bị của tôi đều đầy đủ, tôi cũng không dùng VPN, nên Google lẽ ra phải biết tôi dùng ngôn ngữ nào và đang ở đâu. Vậy mà tôi không hiểu sao lại nhận những quảng cáo đó. Trước đây tôi từng tắt quảng cáo cá nhân hóa trên YouTube, và lúc đó quảng cáo gần như 100% là lừa đảo, deepfake, hàng cấm. Vài tháng trước tôi cố tình bật lại. Từ đó quảng cáo khiêu dâm hay ma túy bất hợp pháp có giảm, nhưng phần lớn vẫn là lừa đảo và tiếp tục chẳng hề khớp với nhân khẩu học của tôi. Quảng cáo chính trị ở nơi cách hàng trăm dặm hay quảng cáo bằng ngôn ngữ tôi không biết quá phổ biến, đến mức thỉnh thoảng nếu có quảng cáo nhà hàng địa phương thì tôi còn nghi ngờ không biết đó là nhắm mục tiêu thật hay chỉ tình cờ. Tôi gần như tin là vế sau
    • Hiện tượng cứ liên tục thấy quảng cáo cho những món mình đã mua rồi chính là ví dụ cho thấy rõ nhất lỗ hổng của quảng cáo nhắm mục tiêu
    • Từ trải nghiệm hạn chế của mình, cuối cùng tôi nghiêng về phía cho rằng bản thân việc nhắm mục tiêu không quan trọng. Facebook tạo cho người dùng một dạng nghiện kỹ thuật số, và người dùng trả giá bằng sự chú ý. Theo tôi, sự chú ý đó được bán cho người trả giá cao nhất. Nội dung quảng cáo không quá quan trọng, còn dữ liệu thu thập được thì được dùng để làm cơn nghiện ấy mạnh hơn
    • Trước đây tôi thường xuyên báo cáo quảng cáo lừa đảo với Facebook, nhưng câu trả lời quay lại luôn kiểu như không có vấn đề gì. Có vẻ với tiêu chuẩn của Facebook thì các video đầu tư AI giả mạo bắt chước người nổi tiếng hay chính trị gia cũng đều ổn, điều đó thật sự khiến tôi tức giận
  • Trước đây tôi từng xem một bản tin nói về giai đoạn cuối của chế độ Ceaușescu, và một trong những chỉ dấu của mức độ đàn áp mà họ nêu ra là các camera video gắn trên cột đèn đường

    • Tôi nghĩ thứ tôi xem có lẽ là tuyên truyền. Ở Romania năm 1989 không có chuyện đó. Đất nước ấy không giàu đến mức triển khai những hệ thống hiện đại như vậy, và tôi có thể nói điều đó với tư cách là người đã trực tiếp sống qua thời kỳ đó
    • Tôi cũng cho rằng bản tin đó gần như là một thứ tuyên truyền không có cơ sở. Không có bằng chứng nào cho thấy chính quyền Romania thập niên 1980 từng gắn camera video lên cột đèn đường. Hơn nữa, tại sao họ lại chi tiền cho công nghệ đắt đỏ như vậy chứ. Khi đó đã có quá nhiều người rình mò và chỉ điểm người khác rồi
  • Bài này tạo cảm giác như do LLM viết

  • Thấy quân phiệt, giám sát, tuyên truyền, chủ nghĩa dân tộc là tôi liên tưởng ngay đến điều gì đó. Tôi bắt đầu nghĩ có phải giờ chúng ta đang ở phe phản diện không

    • Vậy thì tôi muốn hỏi ngược lại. Theo tiêu chuẩn của tôi, liệu có lấy ra được dù chỉ một quốc gia vận hành tử tế mà không phải phe phản diện hay không
    • Theo tôi thì vốn dĩ lúc nào cũng vậy rồi
    • Tôi thường cảm thấy có những người liên tục không nhận ra điều này
    • Kiểu phát biểu này trông giống một câu nịnh để kiếm upvote mà người ở bất kỳ nước nào cũng sẽ thích
  • Cuối cùng, chừng nào cách kiếm tiền trên web vẫn là quảng cáo, thì nhà nước giám sát vẫn sẽ tiếp tục tồn tại

    • Tôi nghĩ kể cả có thành dịch vụ trả phí thì giám sát vẫn sẽ tiếp diễn. Sao lại không chứ. Nó là một nguồn doanh thu bổ sung
    • Tôi cho rằng vấn đề còn độc hại hơn thế. Quyền lực nhà nước muốn giám sát sẽ bắt tay với khu vực tư nhân muốn tối đa hóa doanh thu quảng cáo. Khi đó, các luật sư rất có thể sẽ lập luận rằng ngay từ đầu vốn chẳng hề có quyền riêng tư hay tự do gì cả
    • Tôi cũng thấy ngay cả các trang không có quảng cáo đôi khi vẫn cài theo dõi và fingerprinting cho mục đích marketing nội bộ hoặc bảo mật
    • Dù vậy, tôi không nghĩ bản thân quảng cáo nhất thiết phải cần giám sát
    • Ít nhất thì hướng giải pháp có vẻ khá rõ. Con đường tiến tới một web không quảng cáo có thể không dễ, nhưng rõ ràng đó là một giải pháp đáng theo đuổi vì lợi ích công cộng
  • Có vẻ blog đó đã dính phải hug of death rồi. Tôi để lại liên kết lưu trữ thay thế

  • Tôi nghĩ chuyện này không thể xảy ra ở EU

  • Khi Apple lần đầu đưa ra App Tracking Transparency, tôi bật ngay để chặn tracker, và nó đơn giản, hữu ích đến mức từ đó tôi chẳng còn phải nghĩ nhiều về nó nữa. Điều này tạo cảm giác tương phản rất mạnh với việc các website ngày nay đòi đủ kiểu click gymnastics nếu muốn tắt những dạng theo dõi tương tự

    • Trớ trêu là bản thân Apple cũng là một trong những công ty quảng cáo khổng lồ sống nhờ dữ liệu cá nhân của người dùng. Nhưng bằng cách cho phép chặn các công ty quảng cáo khác và chĩa ngón tay ra ngoài, họ dường như đã giành được gần như trọn vẹn niềm tin của người dùng. Đa số có vẻ cũng không biết Apple kiếm được bao nhiêu doanh thu quảng cáo từ dữ liệu của họ. Bài viết về mảng quảng cáo 4 tỷ USD của Apple
    • Tôi nghĩ ở đây có một hiểu lầm phổ biến. ATT không phải tính năng chặn tracker hoàn toàn. Nếu dùng trình chặn quảng cáo/theo dõi dựa trên DNS và xem log, bạn sẽ thấy nhiều ứng dụng vẫn tiếp tục cố theo dõi. Theo cách tôi hiểu thì ATT gần hơn với việc ngăn theo dõi chéo giữa ứng dụng và website. Nó khiến ứng dụng không thể truy cập IDFA, nhờ đó không dùng được một định danh chung trên nhiều ứng dụng. Ban đầu tác động tài chính rất lớn, nhưng giờ thì các công ty theo dõi có lẽ đã phát triển khá nhiều kỹ thuật tương quan khác. Giải pháp thực sự, theo tôi, là Apple và Google phải cung cấp tùy chọn tắt hoàn toàn tracker trong ứng dụng, và nếu vi phạm thì đuổi khỏi App Store. Nhưng vì họ cũng kiếm rất nhiều tiền từ mạng quảng cáo của chính mình nên tôi không nghĩ họ sẽ làm vậy. Rốt cuộc Apple và Google không đứng về phía chúng ta trong vấn đề này
    • Trớ trêu là Google dù có muốn cũng khó mà tắt third-party cookies, vì làm thế có thể bị coi là hành vi phản cạnh tranh đối với các mạng theo dõi khác, và vì vậy bị tòa án chặn lại
    • Tôi thậm chí còn nghĩ những thủ tục bấm chọn phức tạp cần thiết để tắt theo dõi phải chỉ được pháp luật cho phép trong mô hình opt-in. Cách mặc định đồng ý như hiện nay, ẩn trong những điều khoản mà chẳng ai đọc, cần phải thay đổi
    • Trường hợp của tôi thì ngược lại: dùng Firefox, arkenfox và uBlock Origin chế độ nâng cao nên muốn bật các dạng theo dõi tương tự mới cần đủ kiểu click gymnastics
  • Blog này có lẽ là ứng viên cho thiết kế kém nghiêm túc nhất mà tôi thấy trong năm nay

    • Tôi không rõ về thiết kế, nhưng hình như đâu đó trong đó có bài viết thật. Nhân tiện, tôi đạt khoảng 3000 điểm rồi
  • Mỗi lần đọc bài của tác giả này tôi lại bị phân tâm bởi Space Invaders bên cạnh và cuối cùng quay sang chơi nó. Có thể là vì tôi hơi có xu hướng ADHD, nhưng chắc không chỉ mình tôi như vậy

    • Tôi cũng chơi vài phút rồi không đọc hết bài. Tôi cũng có ADHD, nhưng nói đỡ cho mình thì Space Invaders điều khiển bằng chuột khá vui
    • Nếu tác giả thực sự muốn nói điều gì quan trọng, thì cách bố trí này chẳng khác nào tự làm suy yếu thông điệp đó
    • Tôi thì thấy cứ vừa đọc vừa chơi là được. Kết hợp khá ổn đấy chứ
    • Tôi chỉ đang lướt bình luận, nhưng đọc đến câu này thì quyết định không trì hoãn việc bấm vào nữa. Có vẻ một tiếng tới tôi sẽ dành để chơi Space Invaders
    • Khoan đã, đây là bài viết nào vậy