1 điểm bởi p2c2kbf 2026-04-13 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

AIWatch là một dự án mã nguồn mở theo dõi theo thời gian thực sự cố, uptime và thời gian khôi phục của các dịch vụ AI lớn như Claude, OpenAI, Gemini.

Bảng điều khiển: https://ai-watch.dev
Trang giới thiệu: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

Khi xảy ra sự cố, AI sẽ phân tích nguyên nhân, dự đoán thời gian khôi phục và gửi cảnh báo ngay qua Discord/Slack.

Hôm nay, chúng tôi công bố báo cáo độ tin cậy của 27 dịch vụ (theo tiêu chuẩn tháng 3) dựa trên dữ liệu thu thập trong 12 ngày từ 20 đến 31/3. Vì đây là báo cáo đầu tiên nên thời gian còn ngắn, và từ tháng 4 sẽ được phát hành theo dữ liệu đầy đủ của cả tháng.

3 phát hiện chính

1. Chỉ số % uptime là chưa đầy đủ
Claude API ghi nhận uptime 99%, nhưng đã xảy ra 9 sự cố trong 12 ngày.
Cohere đạt uptime 100% và không có sự cố nào.
Chỉ nhìn vào con số thì có vẻ tương tự, nhưng độ tin cậy thực tế lại hoàn toàn khác.

2. Sự cố ngắn tích lũy lại sẽ thành vấn đề lớn
Together AI có nhiều sự cố nhất trong 12 ngày với 20 lần,
nhưng thời gian khôi phục trung bình là 25 phút nên tổng downtime là 8 giờ 37 phút.
Trong khi đó, ChatGPT chỉ có 4 lần nhưng một trong số đó kéo dài tới 19 giờ 46 phút.

3. Rủi ro phụ thuộc upstream
Sự cố Voice Agent kéo dài 74 giờ của Deepgram bắt đầu từ sự cố của OpenAI.
Những dịch vụ xây dựng AI trên một AI khác sẽ kế thừa nguyên trạng sự cố của dịch vụ phía trên.


Top 5 AIWatch Score (theo tháng 3)

Dịch vụ Score Xếp hạng Sự cố
Cohere API 100 Excellent 0 vụ
Hugging Face 100 Excellent 0 vụ
OpenRouter 99 Excellent 0 vụ
Groq Cloud 93 Excellent 1 vụ
DeepSeek API 92 Excellent 1 vụ
OpenAI API 88 Excellent 1 vụ (2h 56m)
Together AI 84 Good 20 vụ (tb 25m)
ChatGPT 73 Good 4 vụ (dài nhất 19h 46m)
Claude API 59 Fair 9 vụ (thống kê theo từng model)
ElevenLabs 47 Degrading 2 vụ (dài nhất 4h 47m)

Công thức tính Score (theo báo cáo tháng 3): Uptime(50) + số ngày bị ảnh hưởng bởi sự cố(30) + thời gian khôi phục(20) = tối đa 100 điểm
Do dùng tiêu chí affected_days thay vì số lượng sự cố nên có thể so sánh công bằng bất kể cách báo cáo khác nhau.
Công khai toàn bộ phương pháp tính: https://ai-watch.dev/#about-score

ElevenLabs có uptime 97,55%, là dịch vụ duy nhất trong 27 dịch vụ nhận xếp hạng Degrading.
Nếu đang sử dụng dịch vụ voice/audio trong production, cần đặc biệt lưu ý.


Lưu ý

  • Thời gian theo dõi là 20~31/3 (12 ngày), nên vì đây là báo cáo đầu tiên, dữ liệu vẫn còn một phần.
    Từ tháng 4 sẽ được phát hành theo dữ liệu đầy đủ của cả tháng.

Khuyến nghị theo mục đích sử dụng (theo báo cáo tháng 3)

  • Production-critical: Cohere (100 điểm, 0 sự cố), OpenAI API (88 điểm, 1 sự cố/tổng downtime 2h 56m)
  • Độ trễ thấp / ổn định: Groq Cloud (93 điểm, uptime 100%), DeepSeek API (92 điểm)
  • Quy trình coding: Cursor, Windsurf (uptime cao)
  • Voice/audio: Khuyến nghị AssemblyAI + bắt buộc có fallback (ElevenLabs·Deepgram có nhiều sự cố)

Chưa có bình luận nào.

Chưa có bình luận nào.