Chẳng phải chỉ là có những cách như thế này thôi sao..

 

Wow.. thật sự quá đỉnh.. tự nhiên đến mức này luôn

 

Gần đây thỉnh thoảng có thể thấy các trường hợp bị thiệt hại do lưu lượng truy cập quá mức từ các dịch vụ tích hợp với LLM, nên về thực chất cũng có thể xem đây là một biện pháp đối phó cho kiểu tình huống đó. Ví dụ, nếu nhìn vào tính năng tìm kiếm web của ChatGPT thì với đặc tính của nhóm người dùng này, khả năng phát sinh lưu lượng truy cập quá mức theo kiểu “không có ác ý” là khá lớn, và tôi nghe nói những trường hợp này có thể dễ dàng lọc ra bằng cách đối sánh agent đơn giản. Nếu đó thật sự là chủ đích thì rốt cuộc chỉ là con đường làm hao tốn chi phí máy chủ của OpenAI (và cả danh tiếng?) một cách oan uổng mà thôi..

 

Và thông tin thật sự rất dễ tiếp thu...

 

Về mặt đạo đức thì đây không phải là cách hay. Và cũng không phải là giải pháp gốc rễ.

 

Bài viết thú vị thật! Đây là một cách mà tôi chưa từng nghĩ tới, cảm ơn bạn đã chia sẻ!

 

Ồ~ đáng mong đợi đấy.

 

Dạo này có vẻ Google không chỉ cải thiện hiệu năng của các foundation model, mà còn làm rất tốt phần tích hợp chúng vào những dịch vụ như thế này.

 

Wow, cái này đúng là đỉnh thật;;

 

https://freederia.com/researcharchive/
Đây là trang web của nhà khoa học AI.
Hướng đi như vậy sẽ thúc đẩy mạnh hơn nữa sự đa dạng về định hướng.

 

Khi phần thưởng xâm phạm quyền tự chủ của cá nhân, nó sẽ làm suy giảm động lực nội tại là câu nói rất đáng suy ngẫm.

 

Tôi đồng ý rằng dù là User-Agent như bạn nói hay cơ chế phát hiện dựa trên IP được nhắc trong bài gốc, vì thông tin nhận dạng đều có thể bị ngụy trang nên rất khó khẳng định là ác ý hay không. Có lẽ bot thực sự độc hại sẽ tiếp cận tinh vi hơn nhiều.
Theo tôi, thay vì kiểu tấn công này, có lẽ một hướng "nudge" thực tế hơn là cung cấp API thu thập dữ liệu có giới hạn tải, để vẫn cho phép truy cập tự động hợp pháp nhưng bảo vệ được tài nguyên máy chủ. haha

 

Thật sự... quá đỉnh.. Dù có chuyển sang trả phí thì đây vẫn là chất lượng đáng để bỏ tiền ra dùng.
Khi nghe những chủ đề mình quan tâm dưới dạng podcast, mình tiếp thu thông tin một cách hứng thú hơn.
Thích quá

 

Tôi đã thử rồi và đúng là quá đỉnh....

Nếu phải trả tiền để dùng thì có lẽ tôi chỉ dùng mỗi cái này thôi. Các dịch vụ tương tự chắc sẽ bị ảnh hưởng khá lớn.

 

Tất nhiên vì đó không phải là nơi công khai nên cũng có thể chỉ là bài đăng được viết ra mà không suy nghĩ gì nhiều.
Giống như trong cộng đồng, người ta cũng có thể để lại bình luận mà chẳng suy nghĩ gì nhiều.
Tôi không thể chặn hoàn toàn crawler, nên tốt nhất là ngay từ đầu đừng nhận bất kỳ nỗ lực truy cập nào, nhưng tôi tò mò về ý đồ muốn câu kéo sự chú ý đó.

 

Chỉ là blog cá nhân thôi, chẳng lẽ không được viết gì cũng được sao? 🤔

 

Bạn xử lý việc thay đổi phiên bản như thế nào?

 

Mục đích của việc đăng bài như thế này là gì nhỉ?
Tôi nghĩ trên thực tế gần như không có khả năng các công ty đang chạy crawler đọc bài này rồi loại trừ ra.
Vậy bài viết này được viết hướng tới những độc giả nào?
Là một bài giới thiệu để cho những người cũng đang vận hành blog biết rằng có cách như thế này,
hay là một kiểu câu tương tác rằng blog của tôi bảo mật mạnh thế này đấy, nếu làm được thì cứ thử crawl xem?
Tôi thật sự rất tò mò không biết đăng bài này lên thì sẽ nhận được điều gì

 

Vậy tức là nếu phán đoán bot dựa trên IP thì cũng sẽ ném bom vào luôn đúng không haha
Cảm nhận được sự phẫn nộ từ tác giả. haha