- Cloudflare đã công bố kế hoạch ra mắt vào năm tới một marketplace cho phép chủ sở hữu website bán quyền truy cập cào nội dung trang cho các nhà cung cấp mô hình AI
- Marketplace này là giai đoạn cuối trong kế hoạch lớn hơn của CEO Cloudflare Matthew Prince, nhằm giúp các nhà xuất bản kiểm soát tốt hơn cách thức và thời điểm bot AI cào dữ liệu website của họ
- Ở bước đầu tiên, Cloudflare ra mắt AI Audit, một công cụ observability miễn phí
- Chủ sở hữu website sẽ được cung cấp một dashboard để xem phân tích về tần suất các mô hình AI cào dữ liệu trang của họ
- Thông qua AI Audit, chủ sở hữu website có thể chặn bot AI hoặc cho phép các web scraper cụ thể
- Bản demo của AI Audit cho phép chủ sở hữu website xem từng scraper đến từ đâu, đồng thời cung cấp một cửa sổ tùy chọn để xem các nhà cung cấp mô hình AI như OpenAI, Meta, Amazon ghé thăm trang thường xuyên đến mức nào
- Giải quyết vấn đề của ngành AI
- Các nhà cung cấp mô hình AI đang cào dữ liệu từ hàng nghìn website nhỏ và dùng chúng làm nguồn thông tin để vận hành LLM
- Phần lớn website không nhận được bất kỳ khoản bồi hoàn nào, điều này có thể phá vỡ mô hình kinh doanh của nhiều trang web
- Cloudflare đã ra mắt một nút cho phép chủ sở hữu website chặn bot AI
- Phản ánh nhu cầu khách hàng
- Khách hàng của Cloudflare yêu cầu các công cụ giúp họ chọn mô hình AI nào có thể truy cập website của mình
- Công cụ mới của Cloudflare cho phép chặn một số crawler AI trong khi vẫn cho phép các crawler khác
- Mục tiêu của marketplace
- Marketplace của Cloudflare sẽ giúp các nhà xuất bản nhỏ có thể giao dịch với các nhà cung cấp mô hình AI
- Website có thể đặt mức phí cào dữ liệu hoặc yêu cầu tín dụng từ các phòng thí nghiệm AI
- Tác động tới hệ sinh thái AI
- Tình trạng hiện nay khi một số công ty AI không trả bất kỳ chi phí nào cho nội dung là điều không bền vững
- CEO của Cloudflare cho rằng marketplace này về lâu dài sẽ có lợi cho hệ sinh thái AI
Tóm tắt của GN⁺
- Cloudflare đã công bố kế hoạch ra mắt một marketplace cho phép chủ sở hữu website bán quyền truy cập cào nội dung trang cho các nhà cung cấp mô hình AI
- Thông qua công cụ AI Audit, chủ sở hữu website có thể phân tích tần suất các mô hình AI cào dữ liệu website của họ
- Marketplace này sẽ giúp các nhà xuất bản nhỏ có thể giao dịch với các nhà cung cấp mô hình AI, từ đó nhận được bồi hoàn cho nội dung của mình
- Điều này có thể góp phần nâng cao tính bền vững của hệ sinh thái AI
2 bình luận
Ý tưởng này khá hay.
Ý kiến trên Hacker News
Common Crawl được đưa vào danh sách "Providers" cùng với OpenAI và Anthropic
OpenFoodFacts, OpenStreetMap và Wikipedia đang bị tấn công DDoS
Việc ngăn chặn crawling có thể là một nỗ lực vô nghĩa
Cloudflare đang cung cấp dịch vụ bảo vệ khỏi lạm dụng theo một cách mới
Câu hỏi về tương lai của World Wide Web
Có thể xem thêm chi tiết trên blog của Cloudflare
Ví dụ về Bingeclock dùng AI Audit
Bước tiếp theo: dùng AI tạo nội dung, rồi nhận thanh toán khi Cloudflare quét nội dung đó
Việc lặp đi lặp lại cào cùng một website là một sự lãng phí lớn