"Run inference at scale"
-
Hỗ trợ nhiều mô hình, bao gồm TensorFlow, PyTorch, Sklearn
-
Triển khai quy mô lớn trên AWS/GCP/Azure và tự động mở rộng theo request
-
Tích hợp với hệ thống CI/CD
-
Truyền trực tuyến metric hiệu năng và log tới các công cụ giám sát
-
Phục vụ nhiều mô hình hiệu quả với bộ nhớ đệm đa mô hình
-
Hỗ trợ rolling update không downtime
-
Phân chia lưu lượng cho A/B testing
Chưa có bình luận nào.