- Đây là trang cung cấp cập nhật về các sự cố ở phạm vi toàn cầu. Các lỗi phần cứng thường nhật hoặc sự cố hạ tầng có phạm vi hạn chế sẽ không được đưa vào.
- Để xem tất cả sự cố có thể ảnh hưởng đến ứng dụng được cá nhân hóa của bạn, bạn có thể kiểm tra trang trạng thái được cá nhân hóa trong bảng điều khiển của Fly Organization.
Sự cố trước đây
27 tháng 11, 2024
26 tháng 11, 2024
- Độ trễ API và lỗi timeout: Đã khắc phục. Hiệu năng của Machines API và GraphQL API đã trở lại bình thường.
- Suy giảm kết nối: Việc triển khai đầy đủ hạn ngạch CPU đã khiến máy của một số khách hàng bị giới hạn. Điều này gây ra các vấn đề mạng, và thay đổi đã được tạm thời hoàn tác để khắc phục.
- Suy giảm hiệu năng API: Đã khắc phục. Hệ thống đã được mở rộng và các bản sửa lỗi cho API đã được áp dụng, hiện đang vận hành bình thường.
25 tháng 11, 2024
- Suy giảm hiệu năng API: Đang xác định nguyên nhân và khắc phục. Hiệu năng của Machines API và proxy bị suy giảm.
- Khôi phục cụm Corrosion: Đang chạy quy trình khôi phục và reseed, hiện vẫn đang xử lý trên một số host.
24 tháng 11, 2024
23 tháng 11, 2024
22 tháng 11, 2024
- Không thể tìm kiếm log: Đã khắc phục. Ảnh hưởng đến bảng tìm kiếm log của Fly Metrics và log ứng dụng trước đây.
21 tháng 11, 2024
- Bảo trì mạng khẩn cấp: Đã hoàn tất. Nhà cung cấp mạng đã thực hiện thay thế switch.
20 tháng 11, 2024
19 tháng 11, 2024
- Không thể tìm kiếm log: Đã khắc phục. Ảnh hưởng đến bảng tìm kiếm log của Fly Metrics và log ứng dụng trước đây.
18 tháng 11, 2024
17 tháng 11, 2024
16 tháng 11, 2024
15 tháng 11, 2024
14 tháng 11, 2024
- Suy giảm kết nối IPv6 tại IAD: Đã khắc phục. Vấn đề đã được xử lý với sự phối hợp cùng nhà cung cấp upstream.
1 bình luận
Ý kiến trên Hacker News
Một người dùng cho biết trang web được lưu trữ trên fly.io đã bị gián đoạn trong 5 phút, nhưng sau đó vẫn hoạt động ổn định. Họ đang dùng dịch vụ giám sát miễn phí để kiểm tra mỗi 5 phút.
fly.io đã công bố báo cáo hậu kiểm, cho biết vào năm 2016 họ dùng máy chủ TLS tập trung có tên Consul, nhưng đã thay thế bằng Corrosion vào năm 2020. Đến tháng 10/2024, khóa ký root key của Consul hết hạn khiến kết nối bị ngắt, và họ đã khôi phục bằng cách triển khai chứng chỉ SSL mới.
Do sự cố hạ tầng của fly.io, họ phát hiện khóa TLS của các dịch vụ khác cũng đã hết hạn, đồng thời một công cụ ghi log đã gây DDOS lên nhà cung cấp mạng. Cần rất nhiều nỗ lực để giải quyết đồng thời nhiều vấn đề.
Có ý kiến đặt câu hỏi về độ ổn định của fly.io, cho rằng nếu một nền tảng cloud không mang lại độ tin cậy thì thuê máy chủ ảo có thể là lựa chọn tốt hơn.
API của Fly.io vẫn chưa thể truy cập, và người dùng nói rằng họ không thể triển khai hoặc truy cập cơ sở dữ liệu. Có thể xem cập nhật chính xác qua trang cộng đồng.
Một người dùng cho biết khi so sánh Fly.io với Railway.com, họ thấy Railway tốt hơn và hỗ trợ cũng xuất sắc hơn. Fly.io đã không phản hồi yêu cầu xóa dữ liệu.
Có người nói họ đã nhiều lần trải qua các sự cố lớn của Fly.io và nhấn mạnh rằng độ ổn định của dịch vụ phải là ưu tiên hàng đầu.
Turso cũng đang gặp vấn đề liên quan đến sự cố của Fly.io, và CEO đã xác nhận điều này trên Discord.
Có người đặt câu hỏi về mức giá thấp của Fly.io, đồng thời chỉ ra tài liệu kỹ thuật giải thích rằng một instance bị cố định trên một máy chủ vật lý, nên nếu máy chủ đó gặp sự cố thì phải khôi phục từ bản sao lưu.
Có ý kiến nói rằng sự cố thường xảy ra vào các tuần có kỳ nghỉ lớn, và MS 365/Teams/Exchange cũng bị ảnh hưởng. Họ đề xuất nên ngừng thay đổi trong các kỳ nghỉ lớn.
Cũng có ý kiến nhắc rằng chuỗi sự cố vào đầu năm 2023 cũng từng liên quan đến các vấn đề của Corrosion.