1 điểm bởi GN⁺ 3 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Trang trạng thái GitHub hiện hiển thị All Systems Operational và không có sự cố nào được báo cáo vào ngày 27 tháng 5 năm 2026
  • Trong 90 ngày gần nhất, tất cả các thành phần chính đều ở trạng thái Operational, và tỷ lệ hoạt động của Actions là 99.66%, Pull Requests là 99.55%
  • Ngày 26 tháng 5, Actions và Pages gặp lỗi xác thực khiến việc bắt đầu chạy và tải action bị thất bại, ảnh hưởng đến phần lớn các lần chạy Actions
  • Sự cố chậm trễ của Actions vào ngày 20 tháng 5 do health check cấu hình sai gây ra, làm chậm 4.5% tổng số lần chạy và 30% các tác vụ scale set
  • Sự suy giảm của Actions vào ngày 15 tháng 5 xảy ra do lỗi định tuyến trong quá trình chuyển đổi dự phòng theo kế hoạch, với 42% số lần chạy bị thất bại ở thời điểm cao nhất

Trạng thái dịch vụ hiện tại

  • Trang trạng thái GitHub hiện được hiển thị là All Systems Operational
  • Vào ngày 27 tháng 5 năm 2026, hiển thị là không có sự cố nào được báo cáo
  • Trong 90 ngày gần nhất, tất cả các thành phần chính đều ở trạng thái Operational
    • Git Operations: 99.83% uptime
    • Webhooks: 99.73% uptime
    • API Requests: 99.98% uptime
    • Issues: 99.86% uptime
    • Pull Requests: 99.55% uptime
    • Actions: 99.66% uptime
    • Packages: 99.98% uptime
    • Pages: 99.96% uptime
    • Copilot: 99.91% uptime
    • Codespaces: 99.77% uptime
    • Copilot AI Model Providers: 100.0% uptime
  • GitHub cũng cung cấp các trang trạng thái riêng theo khu vực cho GitHub Enterprise Cloud

Sự cố Actions và Pages ngày 26 tháng 5 năm 2026

  • Sự cố Actions và Pages

    • Việc điều tra tình trạng suy giảm hiệu năng của Actions và Pages bắt đầu lúc 10:57 UTC
    • Đến 11:19 UTC, suy giảm khả dụng của Actions đã được xác nhận
    • Đến 11:53 UTC, GitHub đang điều tra lỗi xác thực gây thất bại khi bắt đầu chạy Actions và tải action; tại thời điểm đó, phần lớn các lần chạy Actions bị ảnh hưởng
    • Lúc 12:37 UTC, nguyên nhân của lỗi xác thực ảnh hưởng đến GitHub Actions đã được xác định và quá trình giảm thiểu đang được tiến hành
    • Lúc 13:00 UTC, tình trạng suy giảm của Actions và Pages đã được giảm thiểu, chuyển sang giai đoạn giám sát để xác nhận độ ổn định
    • Lúc 13:18 UTC, sự cố đã được khắc phục; phân tích nguyên nhân gốc rễ chi tiết sẽ được chia sẻ khi sẵn sàng

Sự cố Actions ngày 20 tháng 5 năm 2026

  • Sự cố Actions

    • Trong khoảng 16:00~17:45 UTC, khách hàng GitHub Actions gặp tình trạng chậm bắt đầu chạy quá 5 phút
    • Trong khoảng thời gian bị ảnh hưởng, khoảng 4.5% tổng số lần chạy bị chậm, và các tác vụ scale set bị ảnh hưởng nặng hơn
    • 30% các tác vụ scale set bị chậm và 4% hoàn toàn không thể khởi động
    • Nguyên nhân là health check cấu hình sai của dịch vụ nội bộ chịu trách nhiệm gán tác vụ cho runner
    • Một đợt tăng ngắn về độ trễ ở dependency cấp trên đã khiến health check thất bại trên nhiều pod, và khi các pod đó bị loại khỏi dịch vụ, tải dồn lên phần dung lượng còn lại
    • Tải bổ sung dẫn đến áp lực bộ nhớ, làm lan rộng lỗi dây chuyền trong một regional cluster đến mức không thể tự phục hồi
    • Việc ứng phó được thực hiện bằng cách mở rộng dung lượng của regional cluster còn khỏe và rút lưu lượng khỏi regional cluster bị hỏng; sau đó, độ trễ bắt đầu chạy đã được phục hồi
    • Để ngăn tái diễn, GitHub đang siết chặt cấu hình health check nhằm tránh các kịch bản lỗi dây chuyền, đồng thời đánh giá các biện pháp giảm thiểu tự động để phân phối lại lưu lượng khi có suy giảm theo khu vực
    • Sự cố được khắc phục lúc 20:14 UTC

Suy giảm khả dụng của Actions ngày 15 tháng 5 năm 2026

  • Suy giảm khả dụng của Actions

    • Trong khoảng 07:43~08:48 UTC, một số khách hàng GitHub Actions gặp tình trạng workflow execution thất bại hoặc chậm khởi động
    • Sự cố bắt đầu trong quá trình chuyển đổi dự phòng theo kế hoạch của hạ tầng hỗ trợ mà GitHub Actions sử dụng
    • Trong quá trình chuyển đổi dự phòng, các bản cập nhật service discovery tự động không được lan truyền đúng cách, khiến lưu lượng bị định tuyến sai và làm tăng request timeout ở dependency cốt lõi của điều phối workflow
    • Ở thời điểm ảnh hưởng cao nhất, 42% số lần chạy Actions bị thất bại
    • Các dịch vụ downstream phụ thuộc vào việc thực thi workflow của Actions cũng bị ảnh hưởng, bao gồm GitHub Pages và Copilot cloud services
    • Lúc 08:12 UTC, đội ứng phó đã sửa thủ công vấn đề định tuyến service discovery
    • Tỷ lệ timeout và thất bại nhanh chóng phục hồi, và việc giám sát được tiếp tục cho đến khi mọi dịch vụ bị ảnh hưởng ổn định trở lại
    • Để ngăn tái diễn, GitHub đang triển khai guardrail cho chuyển đổi dự phòng để xác minh trạng thái service discovery trước khi hoàn tất chuyển đổi, tăng cường kiểm tra trước và sau, đồng thời cải thiện khả năng chống chịu của dependency để giảm lỗi dây chuyền timeout trong các sự kiện hạ tầng
    • Sự cố được khắc phục lúc 08:48 UTC

1 bình luận