1 điểm bởi GN⁺ 2026-02-10 | 2 bình luận | Chia sẻ qua WhatsApp
  • Có báo cáo về suy giảm hiệu năng ở một số dịch vụ GitHub, đồng thời xảy ra trì hoãn trong việc gửi thông báo (Notification)
  • Độ trễ trung bình tăng từ khoảng 50 phút ban đầu lên tối đa 1 giờ 20 phút
  • Sau đó hệ thống được khôi phục dần, với độ trễ giảm từ 1 giờ → 30 phút → 15 phút
  • Theo giờ UTC, vào 19:29 ngày 9 tháng 2 năm 2026, sự cố đã được khắc phục và vụ việc được đóng lại
  • GitHub cho biết sẽ công bố phân tích nguyên nhân gốc rễ (RCA) sau

Tổng quan sự cố chậm thông báo của GitHub

  • GitHub báo cáo xảy ra suy giảm hiệu năng ở một số dịch vụ
    • Ở giai đoạn đầu, việc gửi thông báo không diễn ra bình thường
    • Việc điều tra nguyên nhân sự cố vẫn đang được tiến hành

Diễn biến của tình trạng chậm thông báo

  • Trong bản cập nhật đầu tiên, GitHub nêu rõ có độ trễ trung bình 50 phút
    • GitHub cho biết đang triển khai các biện pháp giảm thiểu
  • Ở bản cập nhật sau đó, độ trễ xấu đi thành 1 giờ 20 phút, nhưng đã quan sát thấy dấu hiệu phục hồi
  • Hệ thống dần được khôi phục, độ trễ giảm từ 1 giờ → 30 phút → 15 phút
    • GitHub giải thích rằng họ đang xử lý backlog (các thông báo tồn đọng)
  • Cuối cùng, vấn đề chậm thông báo đã được giải quyết, và việc gửi thông báo bình thường đã được nối lại

Kết thúc sự cố và các biện pháp tiếp theo

  • Theo giờ UTC, vào 19:29 ngày 9 tháng 2 năm 2026, sự cố đã được giải quyết hoàn toàn
  • GitHub bày tỏ lời cảm ơn tới sự kiên nhẫn và thấu hiểu của người dùng
  • Kết quả phân tích nguyên nhân gốc rễ (Root Cause Analysis) sẽ được công bố ngay khi sẵn sàng

Tính năng thông báo cho người dùng và đăng ký theo dõi

  • Người dùng có thể đăng ký theo dõi cập nhật sự cố qua email, SMS, Slack, Webhook, v.v.
  • Khi đăng ký, người dùng phải đồng ý với chính sách quyền riêng tưđiều khoản dịch vụ của GitHub và Atlassian
  • Trang web được bảo vệ bởi Google reCAPTCHA

Tóm tắt

  • Sự cố lần này là vấn đề chậm trong hệ thống thông báo của GitHub, với quá trình khôi phục theo từng giai đoạn kéo dài khoảng 4 giờ
  • Dịch vụ hiện đã trở lại trạng thái bình thường, và báo cáo phân tích bổ sung sẽ được công bố sau

2 bình luận

 
joyfui 2026-02-10

Hóa ra việc GitHub phun ra lỗi vào rạng sáng nay không chỉ xảy ra với mình tôi.

 
GN⁺ 2026-02-10
Ý kiến trên Hacker News
  • GitHub không còn công khai thống kê độ sẵn sàng dịch vụ nữa nên tôi đã tự parse dữ liệu
    Hiện tại xét trên toàn bộ dịch vụ thì có vẻ chỉ ở mức ‘single 9’
    Có thể xem tại trang GitHub Statuses

    • Làm tôi nhớ đến trang trạng thái GitHub ngày xưa. Khi đó họ hiển thị thời gian hoạt động thực tế rất minh bạch, nên cũng chẳng lạ khi sau khi sự thật lộ ra thì nó bị thay bằng trang hiện tại
      Tôi cũng đã xem kỹ phần giải thích kèm link archive.org
    • Cách gọi là ‘single 9’ cho toàn bộ dịch vụ thực ra không có ý nghĩa về mặt cách tính độ sẵn sàng
      Số liệu theo từng mảng thì ổn, nhưng gộp tất cả dịch vụ vào một chỉ số là vô nghĩa
      Hầu hết đều trên 99.5%, ngoại trừ Copilot
    • Khá thú vị khi tổng thể của Copilot lại thấp nhất
      Tôi dùng hằng ngày nhưng hầu như không cảm nhận thấy vấn đề. Có lẽ thời điểm ghi nhận sự cố bị phản ánh chậm
    • Tôi không hiểu vì sao downtime hôm nay lại bị phân loại là ‘minor’
      Web UI gần như không hoạt động, nên tôi tự hỏi liệu GitHub có đang báo cáo giảm nhẹ mức độ nghiêm trọng của sự cố hay không
    • Dự án rất tuyệt. Cảm ơn vì đã chia sẻ như vậy
  • Vài năm trước tôi chưa từng nghĩ vị thế thống trị của GitHub sẽ bị đe dọa
    Nhưng nếu vận hành cứ bất ổn như bây giờ thì có lẽ nó sẽ được ghi nhớ như một pha tự bắn vào chân điển hình của ngành

    • Có vẻ từ sau cuộc di cư ‘mang tính sống còn’ sang Azure năm ngoái, mức độ sẵn sàng đã giảm một hai bậc
    • Tôi đang xem trang “Migrate from GitHub” trong tài liệu GitLab
      Nếu có thể chuyển cả issue và project thì tôi sẽ nghiêm túc cân nhắc việc rời đi
    • Tôi nghĩ đây không chỉ là vấn đề vận hành mà còn là vấn đề về kiến trúc và chất lượng mã
      Nhìn vào sản phẩm GitHub Enterprise self-hosted là có thể thấy độ phức tạp của nó
    • Tôi không có bằng chứng, nhưng đoán rằng các sự cố dày đặc gần đây có thể cũng là tác dụng phụ từ chiến lược lấy AI làm trung tâm
    • Tôi nghĩ đây là kết quả của việc Microsoft ép chuyển sang Azure và ưu tiên khối lượng công việc AI
      GitHub là con ngỗng đẻ trứng vàng của dữ liệu phát triển phần mềm toàn cầu, nên nếu cứ bất ổn như hiện tại thì chính thương hiệu cũng gặp nguy
      Windows 11 cũng không ổn, và GitHub có thể đánh mất vai trò nền tảng của phát triển hiện đại
  • Tôi đang xử lý một lỗi bảo mật của Caddy thì GitHub sập, mở report ra chỉ thấy trang kỳ lân
    Tôi định tranh thủ tập trung trong 2 giờ không có con bên cạnh, nhưng giờ lo rằng vòng phản hồi sẽ bị đẩy sang ngày mai vì sự cố này
    Dù vậy, tôi vẫn biết ơn vì GitHub Sponsors đang giúp mình kiếm sống

    • Tôi tò mò không biết đó là lỗi bảo mật gì
    • Tôi muốn hỏi liệu bạn có từng cân nhắc nền tảng thay thế nào chưa. Với người tự vận hành server như tôi thì bảo mật là chuyện rất quan trọng
  • Có thể nhìn GitHub vỡ vụn rồi phát nổ theo thời gian thực
    GitHub Status History gần như ở mức hài kịch

    • Mới ngày 9 tháng 2 mà đã có 14 sự cố rồi
      Thật mỉa mai khi lại thấy giai đoạn ‘vị cứu tinh’ của ngành AI trôi qua theo cách này
      Bài liên quan: link The Verge
    • Có người đùa rằng muốn đảo ngược xu hướng này thì phải làm thêm vibe coding
    • Dù vậy, GitHub công khai minh bạch như thế này vẫn là điều tốt
      Họ không giấu downtime nên người dùng còn có thể ứng phó, và chắc sớm sẽ có postmortem
    • Có lẽ hiện tượng này sẽ còn tiếp diễn cho tới khi việc di cư sang Azure hoàn tất
    • Giá mà có bản trực quan hóa theo năm giống biểu đồ đóng góp trên hồ sơ GitHub thì hay
  • Từ đầu năm đến nay GitHub gặp nhiều sự cố đến mức gần như cập nhật trang trạng thái mỗi ngày
    Nhìn vào lịch sử trạng thái thì ngay cả với một dịch vụ lớn, đây cũng không phải bình thường
    Thậm chí còn có câu đùa rằng cứ khoảng 4 giờ chiều là GitHub Actions lại đứng hình
    Tôi mong phía nội bộ công khai nguyên nhân và biện pháp khắc phục

    • Kể từ khi các coding agent xuất hiện, lưu lượng vận hành có thể đã tăng gấp 100 lần
      GitHub vốn được thiết kế cho một quy mô khác, nên giờ giống như đột ngột hứng một mức tải hoàn toàn mới
  • Ban đầu trang trạng thái chỉ hiển thị độ trễ thông báo, nhưng thực tế cứ truy cập PR là trang kỳ lân hiện ra liên tục
    Sau đó mới có thêm trang trạng thái riêng cho PR, rồi cuối cùng mở rộng thành sự cố toàn dịch vụ
    Link sự cố liên quan

    • Mục “đang điều tra hiện tượng suy giảm hiệu năng ở một số dịch vụ” đã được thêm vào
      Lúc 16:10 UTC thì chưa có, nhưng vài phút sau đã xuất hiện
    • Khi approve PR, JSON API lại trả về trang lỗi HTML. Có vẻ bên trong đã rối tung hoàn toàn
    • Tôi cũng thường xuyên thấy lỗi 500. Độ trễ cũng tăng vọt
      Link giám sát
    • Ngay cả khi truy cập chi tiết commit cũng chỉ hiện trang kỳ lân
    • Ngay cả lệnh git cũng không hoạt động
  • Tôi đã hoàn tất việc di cư sang Forgejo trong vài tuần gần đây
    Công ty chúng tôi muốn giảm phụ thuộc vào các đám mây lớn, nên chuyện hạ tầng cốt lõi dừng hoạt động chỉ vì GitHub/Azure gặp sự cố là điều không thể chấp nhận
    Quá trình chuyển đổi diễn ra suôn sẻ, và chúng tôi cũng đang làm thêm vài phần tùy biến

    1. Tạo runner dựa trên Firecracker để chạy CI trong môi trường VM từ Forgejo Actions
    2. Đang chuẩn bị một đề xuất thêm tính năng nhóm biến môi trường
      Cộng đồng rất thân thiện và chào đón, nên tôi hy vọng Forgejo sẽ tiếp tục phát triển
      Link công ty, link thảo luận đề xuất
    • Nếu ở London thì tại sao lại dùng domain .eu, tôi cũng tò mò về vị trí server và nhà cung cấp hosting
  • Sự bất ổn của GitHub giờ đã không còn có thể chấp nhận được nữa
    Nếu sau này tôi có thể ảnh hưởng đến việc chọn nơi lưu trữ mã nguồn, tôi sẽ cố tránh GitHub

    • Về tính năng thì các forge khác cũng đã đủ sức thay thế
      Chỉ là khả năng được khám phátín hiệu xã hội (star, fork) của GitHub vẫn rất hấp dẫn
      Cách thực tế hơn là dùng forge nội bộ (GitLab, Gitea, v.v.) rồi mirror sang GitHub
      Trớ trêu thay, nếu GitHub tốt hơn thì tôi đã dùng gói trả phí, còn bây giờ tôi chỉ dùng miễn phí và mang tiền sang chỗ khác
  • Trong 3 tháng qua đã có 3 lần sự cố quy mô lớn
    Điều này cũng được ghi rõ trong lịch sử trạng thái

    • Tôi tự hỏi gần đây đã có ai rời đội ngũ hay không. Có thể người nắm tri thức cốt lõi đã rời đi, hoặc vận hành bị chuyển sang khu vực khác chăng
    • Chúng tôi chỉ còn 2 tuần nữa là ra mắt MVP mà lại gặp thêm sự cố, thật bực bội. Độ tin cậy quá thấp
    • Có người cũng đùa rằng liệu đây có phải lại do vibe coding không
  • Tình hình lúc này trông chẳng khác gì hậu quả của việc AI thay thế kỹ sư

    • “Đúng rồi, xin lỗi nhé. Tôi đã xóa cơ sở dữ liệu của bạn.” — một câu đùa đáp lại
    • Thực ra tôi biết GitHub đang chuyển sang Microsoft Azure, nên mới xảy ra những đợt downtime như thế này
    • Châm biếm kiểu như Tay.ai và Zoe.ai đang đánh nhau bên trong nên không giữ nổi dịch vụ