Tầm nhìn của Mozilla về thông tin xác thực web nhằm giữ vững tính mở và quyền riêng tư ngay cả trong thời đại bot
(blog.mozilla.org)- Khi tình trạng lạm dụng bằng bot gia tăng, các trang web tăng cường yêu cầu CAPTCHA và đăng nhập, khiến cả người dùng hợp lệ cũng phải chịu ma sát truy cập và suy giảm quyền riêng tư
- Việc tăng cường chống theo dõi trong trình duyệt là cần thiết để bảo vệ người dùng, nhưng cũng làm suy yếu các tín hiệu như địa chỉ IP và dấu vân tay trình duyệt mà các trang web vốn dùng cho chống lạm dụng
- Mozilla cho rằng các cơ chế chứng minh độ tin cậy của thiết bị như Web Environment Integrity có nguy cơ trao quyền kiểm soát truy cập web cho một số ít nhà cung cấp OS và phần cứng
- Giải pháp thay thế là mô hình thông tin xác thực ẩn danh, cho phép kiểm tra xem người dùng có đang trong giới hạn sử dụng hợp lý hay không mà không tiết lộ danh tính hay nơi cấp phát
- Cloudflare cùng các trình duyệt khác và các bên liên quan trong hệ sinh thái web đã bắt đầu thiết kế hệ thống này, với mục tiêu giảm CAPTCHA, chặn nhầm không cần thiết và yêu cầu tự định danh
Điểm xung đột giữa bảo vệ quyền riêng tư và chống lạm dụng
- Việc bảo vệ quyền riêng tư trên web đang tiếp tục được tăng cường
- Các trình duyệt ưu tiên quyền riêng tư đang loại bỏ cookie của bên thứ ba
- Chúng đối phó với bên theo dõi bằng cách hạn chế theo dõi qua dấu vân tay trình duyệt và che giấu địa chỉ IP
- Những thay đổi này tạo ra chi phí mới cho trải nghiệm người dùng
- Người dùng phải đối mặt với nhiều CAPTCHA hơn, nhiều yêu cầu đăng nhập hơn và nhiều trang chặn hơn
- Địa chỉ IP và dấu vân tay trình duyệt từng được dùng để lập hồ sơ người dùng, nhưng đồng thời cũng là tín hiệu cho chống lạm dụng của website
- Sự gia tăng lưu lượng bot cũng trực tiếp tạo gánh nặng cho vận hành website
- Các hành vi lạm dụng quy mô lớn như credential stuffing và spam có thể gây ra thiệt hại thực tế
- Ngay cả khách truy cập hợp lệ cũng phải chấp nhận nhiều ma sát hơn và quyền riêng tư thấp hơn, còn website có thể đẩy ra ngoài chính những người dùng mà họ vốn muốn phục vụ
- Nếu không có thay đổi, người dùng sẽ bị ép phải chọn một trong hai: quyền riêng tư hoặc quyền truy cập web
- Các đề xuất như Web Environment Integrity (WEI) vận hành bằng cách buộc người dùng chứng minh với website rằng thiết bị và phần mềm của họ là “đáng tin cậy”
- Mozilla cho rằng cách tiếp cận này chuyển quyền kiểm soát thiết bị từ người dùng sang một số ít nhà cung cấp OS và phần cứng
- Các bên đó sẽ quyết định thiết bị và phần mềm nào được phép truy cập web, đi ngược lại với web mở
Cách chứng minh giới hạn tốc độ bằng thông tin xác thực ẩn danh
- Cốt lõi của thiệt hại do bot nằm ở khả năng triển khai trên quy mô lớn
- Website không cần biết danh tính của người dùng
- Cũng không cần xác minh rằng thiết bị của người dùng chỉ chạy phần mềm đã được phê duyệt
- Chỉ cần biết rằng họ đang ở trong giới hạn tốc độ hợp lý
- Để giới hạn tốc độ có hiệu quả, kẻ tấn công phải khó tạo danh tính mới để đặt lại hạn mức
- Đây cũng là lý do website yêu cầu địa chỉ email, đăng nhập liên kết hoặc dấu vân tay thiết bị: để khiến việc lấy định danh mới trở nên tốn kém
- Vấn đề là những định danh này cũng có thể bị dùng để theo dõi
- Mối quan hệ người dùng sẵn có ở website khác có thể đóng vai trò bảo chứng âm thầm
- Ví dụ, một website có quan hệ với người dùng như thuê bao hoặc tài khoản lâu năm có thể đứng ra bảo chứng
- Website mà người dùng ghé thăm lần đầu có thể tin rằng đây là người dùng thật đang ở trong hạn mức, nhưng không được biết danh tính của họ hay nguồn bảo chứng
- Trường hợp VPN cho thấy rõ vì sao cần cách tiếp cận này
- Nhiều website chặn toàn bộ lưu lượng VPN vì cho rằng trong đó lẫn cả lưu lượng hợp lệ lẫn lưu lượng lạm dụng
- Nếu dịch vụ VPN có thể bảo chứng theo từng thuê bao, website sẽ quản lý được giới hạn tốc độ theo từng người đăng ký
- Tuy nhiên, nếu hệ thống bảo chứng khiến người dùng VPN bị theo dõi, thì mục đích sử dụng VPN sẽ bị phá hỏng
- Private Access Tokens của Apple, dựa trên Privacy Pass, cung cấp token dùng một lần để ngăn liên kết giữa các lần truy cập
- Mozilla cho rằng cách này vẫn có những giới hạn quan trọng
- Giống WEI, nó vẫn dựa vào chứng minh thiết bị nên chưa tránh được việc phần cứng trở thành cổng kiểm soát
- Cũng khó mở hệ thống để nhiều chủ thể hơn có thể bảo chứng cho người dùng mà vẫn giữ được quyền riêng tư, và quyền kiểm soát có thể bị tập trung vào số ít bên
- Cấu trúc mà Mozilla hướng tới là một hệ thống nơi bất kỳ ai cũng có thể bảo chứng cho người dùng, còn mỗi website tự chọn bên bảo chứng mà mình tin cậy
- Anonymous credentials cho phép người dùng sử dụng thông tin xác thực do một chủ thể cấp để sau này xuất trình với website trong số lần giới hạn, đồng thời ngăn website và bên cấp phát theo dõi việc sử dụng
- Thậm chí có thể che giấu cả việc ai đã cấp thông tin xác thực, và chỉ chứng minh rằng nó đến từ một bên thuộc tập hợp các bên cấp phát đáng tin cậy
- Mozilla đã bắt đầu thiết kế hệ thống như vậy cùng với Cloudflare và các bên liên quan trong hệ sinh thái web, bao gồm các trình duyệt khác
- Cách tiếp cận chi tiết hơn có thể xem tại Mozilla Hacks: PACT: Anonymous Credentials for the Web
- Mục tiêu cuối cùng là giảm CAPTCHA, giảm chặn nhầm không cần thiết và giảm yêu cầu tự định danh mà không làm tổn hại quyền riêng tư
1 bình luận
Ý kiến trên Lobste.rs
Tuy vậy, kênh phụ về thời gian vẫn là điều đáng lo. Thông tin xác thực ẩn danh có thể trình nhiều lần hiện giúp giảm kiểu kênh phụ này khá tốt so với các token dùng một lần hiện được triển khai trong Privacy Pass
Tuy nhiên, đoạn “nếu người dùng hoàn toàn không có Endorsement từ một Anchor phù hợp, thì có thể khởi tạo Credential bằng các cơ chế hiện có như CAPTCHA, tạo tài khoản hoặc đăng nhập liên kết” khiến tôi thấy nghi ngờ
CAPTCHA không hoạt động tốt, ngoài việc giữ người dùng ở lại đủ lâu để bị lấy dấu vân tay, còn việc tạo tài khoản và đăng nhập liên kết thì rốt cuộc vẫn phải dựng cổng bằng cơ chế khác, nên chỉ là đẩy vấn đề lên thêm một tầng
Hơn nữa, bạn cũng không thể bắt ai đó đang dùng máy tính ở thư viện để đăng nhập ngân hàng phải tạo tài khoản mới trên một website khác. Ngày nay, các “cơ chế hiện có” phụ thuộc rất nhiều vào lấy dấu vân tay trình duyệt, hoặc như Apple thì dựa vào chứng thực phần cứng; nếu mục tiêu của Mozilla và những bên khác là khiến việc lấy dấu vân tay trở nên bất khả thi, tôi không rõ chuyện này sẽ vận hành thế nào
Nhưng vấn đề chính của Internet không phải là Shopify bị mất tiền vì gian lận, mà là nội dung chúng ta từng truy cập đang biến mất
Ví dụ như đừng nhét AI vào mọi thứ, và ngay từ đầu đừng hỗ trợ hay tạo điều kiện cho các công ty đã gây ra mớ hỗn độn này. Nếu các crawler đơn giản là ngừng hoạt động thì đã không cần đến những biện pháp đối phó kiểu này
Dù AI đúng là đã gây ra đột biến lưu lượng, nhưng vấn đề này tồn tại từ rất lâu trước AI, và crawler thậm chí cũng không phải vấn đề nghiêm trọng nhất. Chẳng hạn, việc thử dump thông tin xác thực bị rò rỉ để đăng nhập ngân hàng, hoặc brute-force thẻ quà tặng và thẻ tín dụng còn là vấn đề lớn hơn
Ngay cả khi AI biến mất, chúng ta cũng chỉ quay về thế giới ở mức năm 2021, mà khi đó vấn đề này đã nghiêm trọng từ rất lâu rồi