Tải xuống một cách có trách nhiệm
(blog.geofabrik.de)- Nhờ nâng cấp hạ tầng máy chủ tải xuống trong tháng này, trải nghiệm tải xuống sẽ nhanh hơn
- Cách yêu cầu tệp “…latest” đã được chuyển sang chuyển hướng HTTP
- Nỗ lực giúp mọi người dùng có thể truy cập dữ liệu OSM mới nhất một cách thuận tiện
- Các trường hợp sử dụng bất thường lặp đi lặp lại việc tải quá mức các tệp dung lượng lớn đang làm giảm hiệu năng của toàn bộ dịch vụ
- Đưa ra ba khuyến nghị cụ thể để tải xuống hiệu quả và có trách nhiệm
Cập nhật máy chủ tải xuống và khuyến nghị sử dụng có trách nhiệm
Trong tháng này, chúng tôi đã tiến hành tăng cường hạ tầng cho máy chủ tải xuống.
Nhờ đó, đã có thể xây dựng môi trường cung cấp tải xuống nhanh hơn, sớm hơn.
Về thay đổi kỹ thuật, khi yêu cầu tệp “…latest”, thay vì truyền trực tiếp như trước đây, hệ thống sẽ dùng HTTP redirect để đưa tới tệp của phiên bản mới nhất.
Vì sao cần tải xuống có trách nhiệm
Máy chủ đang được vận hành để mọi người dùng có thể dễ dàng truy cập dữ liệu OSM (OpenStreetMap) mới nhất.
Tuy nhiên, đã xuất hiện trường hợp một số người dùng lặp lại việc tải cùng một tệp dung lượng lớn (ví dụ: 20GB) hàng trăm đến hàng nghìn lần mỗi ngày.
- Ví dụ, đã có trường hợp một người dùng tải tệp italy-latest.osm.pbf gần 10.000 lần trong vòng 24 giờ
- Một số trường hợp khác thì lặp lại hành vi tải toàn bộ mọi tệp trên máy chủ mỗi ngày
Những hành vi này gây ra tình trạng chậm cho toàn bộ người dùng do giới hạn băng thông của máy chủ.
Nếu buộc phải chặn dải IP, cả những người dùng không liên quan cũng có thể bị ảnh hưởng.
Ba khuyến nghị cụ thể dành cho người dùng máy chủ
- Nếu cần dữ liệu toàn cầu, thay vì tải chia nhỏ từ máy chủ này, nên tải một lần tệp planet từ planet.openstreetmap.org
- Nếu muốn cập nhật hằng ngày dữ liệu cấp châu lục hoặc khu vực rộng (ví dụ: Europe, North America), hãy dùng pyosmium-up-to-date để chỉ tải phần thay đổi; cách này giúp giảm 98% lưu lượng và còn nhanh hơn
- Nếu sử dụng script tự động, cần giám sát nội dung đang được tải xuống hoặc thêm xử lý lỗi phù hợp để tránh các sai sót như tải lặp vô hạn cùng một tệp
Kết luận
Hãy cùng tham gia xây dựng môi trường để mọi người đều có thể sử dụng dữ liệu mới nhất một cách thuận tiện hơn thông qua thói quen tải xuống có trách nhiệm.
1 bình luận
Ý kiến trên Hacker News
curlduy nhất<br>Có rất nhiều hiểu lầm rằng dùng BitTorrent thì phải seed, và điều đó khiến người ta e ngại<br>Cuối cùng, thật đáng tiếc khi BitTorrent bị đánh giá thấp chỉ vì hình ảnh của nó và vì mọi thứ đều có thể làm chỉ vớicurl<br>Có những trường hợp như client game dùng BT để cập nhật hoặc PeerTube dùng webtorrent, nhưng vẫn tiếc là nó chưa được sử dụng rộng rãi hơnapt-getthì quá tốn thời gian