Fly.io, giờ đã có GPU
(fly.io)AI thực sự rất tuyệt
- Fly.io là một dịch vụ đám mây công khai mới cho phép đặt năng lực tính toán ở gần người dùng.
- Giờ đây có thể dùng GPU để xử lý các khối lượng công việc AI trong môi trường điện toán biên.
- Fly.io cho phép chạy ứng dụng full-stack hoặc nền tảng phát triển dựa trên Fly Machines API ở gần người dùng.
Các trường hợp sử dụng thực tế với GPU của Fly.io
- Có thể triển khai mã nguồn của riêng mình và mô hình ưa thích trên backbone đám mây của Fly.io.
- Với GPU của Fly.io, có thể dễ dàng chạy ứng dụng GPU chạy Ollama (những người bạn trong lĩnh vực tạo sinh văn bản) chỉ qua hai bước.
- Có thể triển khai ứng dụng bằng cách thêm cấu hình vào
fly.tomlvà chạy lệnhfly apps create sandwich_ai && fly deploy.
Tốc độ ánh sáng có giới hạn
- Khởi động GPU nhanh là tốt, nhưng Fly.io thực sự phát huy giá trị ở suy luận tại biên.
- Ví dụ có thể là một ứng dụng cho phép người dùng nhập các nguyên liệu có trong bếp và nhận ngay công thức sandwich.
- Fly.io có GPU tại các trung tâm dữ liệu trên toàn thế giới và cho phép chạy cùng một chương trình ở mọi khu vực có hỗ trợ GPU.
Chỉ khi thực sự cần
- GPU là thiết bị xử lý song song mạnh mẽ nhưng không hề rẻ.
- Có thể thêm mục
servicesvào tệpfly.tomlđể chỉ định cách ứng dụng mở rộng và thu hẹp. - Có thể cấu hình để không phải trả chi phí GPU khi người dùng không yêu cầu công thức sandwich.
Thông tin chi tiết
- Cung cấp GPU tại nhiều khu vực ở Mỹ, châu Âu và Sydney.
- Cung cấp nhiều tùy chọn GPU và mức giá khác nhau, và mặc định mọi lần triển khai đều dùng tám lõi CPU AMD EPYC.
- Có thể gắn volume tối đa 500GB, đồng thời cũng có giảm giá cho reserved instance và dedicated host.
GN⁺ ý kiến:
- Fly.io cung cấp một dịch vụ đám mây đổi mới cho phép xử lý khối lượng công việc AI trong môi trường điện toán biên, tập trung vào việc cải thiện trải nghiệm người dùng.
- Dịch vụ tận dụng GPU mang đến giải pháp cân bằng cả tốc độ suy luận nhanh lẫn hiệu quả chi phí, đặc biệt phù hợp với các ứng dụng cần năng lực tính toán cao theo thời gian thực.
- Đây là một bước tiến rất thú vị và hữu ích vì có thể nâng cao khả năng tiếp cận công nghệ AI và giúp các nhà phát triển tạo ra những ứng dụng đổi mới mới.
1 bình luận
Ý kiến trên Hacker News
cogmà replicate dùng hay không, và liệu có thể chạy các mô hình được đóng gói sẵn với cùng prediction API hay không. Họ cho rằng replicate có thể khiến mọi người chần chừ, nhưng nếu hỗ trợ điều này thì trải nghiệm sẽ mượt mà hơn nhiều.