- Các mô hình frontier của OpenAI và Codex hiện đã chính thức có mặt trên AWS, cho phép hàng triệu khách hàng AWS xây dựng với OpenAI ngay trên nền tảng họ đang vận hành doanh nghiệp
- Doanh nghiệp có thể đưa frontier AI vào production thông qua các quy trình bảo mật, tuân thủ, mua sắm, thanh toán và quản trị hiện có, giúp giảm ma sát từ giai đoạn đánh giá đến triển khai thực tế
- OpenAI models on Amazon Bedrock cho phép xây dựng ứng dụng AI bằng các cơ chế bảo mật và kiểm soát quản trị gốc của AWS
- Codex on Amazon Bedrock đưa tác nhân kỹ thuật phần mềm của OpenAI, hiện được hơn 5 triệu người dùng mỗi tuần, vào môi trường AWS để hỗ trợ viết mã, review, debug và hiện đại hóa mã nguồn
- Trong tương lai, Daybreak sẽ được cung cấp cho khách hàng AWS, đưa review mã bảo mật, mô hình hóa mối đe dọa, xác minh bản vá, phân tích rủi ro phụ thuộc, phát hiện và hướng dẫn cải thiện vào vòng lặp phát triển hằng ngày
Đưa OpenAI vào production trên AWS
- Các mô hình frontier của OpenAI và Codex hiện đã được cung cấp rộng rãi trên AWS
- Khách hàng AWS có thể sử dụng các khả năng của OpenAI thông qua nền tảng AWS nơi họ đang vận hành doanh nghiệp
- Những rào cản lớn của doanh nghiệp như bảo mật, tuân thủ, mua sắm, thanh toán và quy trình quản trị có thể được xử lý trong các workflow hiện có
- Các tổ chức có thể giảm rào cản vận hành và chuyển nhanh hơn từ giai đoạn đánh giá sang triển khai thực tế
Cách cung cấp và kế hoạch mở rộng
- OpenAI models on Amazon Bedrock cho phép tạo ứng dụng AI bằng các cơ chế bảo mật và kiểm soát quản trị gốc của AWS
- Codex on Amazon Bedrock được cung cấp như một tác nhân kỹ thuật phần mềm hỗ trợ các nhóm viết mã, review, debug và hiện đại hóa trong môi trường AWS nơi họ đã xây dựng và triển khai
- Cả hai hình thức cung cấp đều có thể sử dụng tại các region AWS Commercial và GovCloud
- OpenAI và AWS có kế hoạch tiếp tục mở rộng các khả năng của OpenAI được cung cấp thông qua AWS để giúp các nhóm chuyển từ đánh giá sang production với ít ma sát hơn và mức độ tin cậy cao hơn
- Daybreak, sẽ được cung cấp trong tương lai, bao gồm cyber model và Codex Security, được thiết kế để giúp các đội phòng thủ an ninh mạng nhìn thấy rủi ro sớm hơn, phản ứng nhanh hơn và làm cho phần mềm có khả năng chống chịu tốt hơn
1 bình luận
Ý kiến trên Hacker News
Mỗi lần thấy ai đó hỏi vì sao lại tin tưởng AWS, Azure hay GCP và vì sao lại chịu trả premium cho chúng, tôi lại nghĩ là người đó chưa từng làm trong môi trường doanh nghiệp
Tập đoàn lớn nơi tôi làm việc có các điều khoản quản trị dữ liệu rất nghiêm ngặt trong hợp đồng với khách hàng, đồng thời cũng có các yêu cầu quản trị nội bộ riêng. Cách để tránh bị sa thải và bị kiện là chỉ dùng những nhà cung cấp không chỉ đã được phê duyệt về an ninh thông tin mà còn được nêu rõ là bên xử lý dữ liệu trong hợp đồng khách hàng
Ở nhà thì bạn có thể làm gì cũng được với code và dữ liệu của mình, nhưng với dữ liệu công ty và dữ liệu khách hàng thì tuyệt đối không. Lý do không thể tùy tiện dùng bất kỳ mô hình frontier mới đang thịnh hành nào cũng y như vậy. Dự án cá nhân và startup có các ràng buộc và yếu tố cần cân nhắc hoàn toàn khác
Đọc phần chữ nhỏ khá thú vị đấy. Trách nhiệm đối với mất mát dữ liệu phần lớn thuộc về khách hàng, các yêu cầu bồi thường theo SLA phải đưa ra bằng chứng cụ thể, và biện pháp khắc phục được chấp nhận thường chỉ là tín dụng sử dụng trong tương lai cho đúng sản phẩm đã làm mất dữ liệu
Điều khoản của AWS thực ra còn khá hợp lý nếu so với những nơi như GCP. SLA của GCP có vẻ chủ yếu hữu ích để đội mua sắm doanh nghiệp nói rằng “vì có SLA nên chúng tôi đã thẩm định rồi, chọn cái này chắc sẽ không bị sa thải.” Trong khi đó GCP có thể nói “khi ký hợp đồng bạn đã chấp nhận biện pháp khắc phục được đề xuất rồi, nên nếu kiện chúng tôi sẽ chỉ vào điều khoản đó thôi. Cảm ơn vì đã tin tưởng.” [0]
[0] https://docs.cloud.google.com/storage/docs/storage-classes
Lưu trữ Standard đa vùng hoặc hai vùng có SLA khả dụng 99.95%, Standard theo vùng là 99.9%, còn Nearline, Coldline, Archive theo vùng có thể xuống tới 99.0%. Tín dụng là 10%, 25%, 50% trên hóa đơn tháng của tầng dịch vụ bị ảnh hưởng, tổng mức trần cộng dồn theo tháng là 50% và được áp dụng cho việc sử dụng trong tương lai. Google cũng nói rằng nếu khách hàng không yêu cầu tín dụng trong vòng 30 ngày thì sẽ bị coi là từ bỏ quyền đó
AWS cũng có thể bị hack, nhưng họ đã chú trọng giảm phần nào khả năng đó và giúp việc truy vết khách hàng nào bị ảnh hưởng trở nên dễ hơn. Ví dụ, nếu đào sâu vào logging của AWS thì chỉ cần bật lên thôi cũng có cực nhiều bản ghi, đủ để lần lại ai đã làm gì với quyền hạn hay môi trường nào. Có lẽ việc truy cập của nhân viên AWS cũng được ghi lại khá đầy đủ. Trước đây để gắn một nhân viên AWS vào tài khoản của tôi còn phải qua nhiều thủ tục
Tôi thật sự sốc khi biết việc dùng một giấy phép GitHub Copilot trên Azure lại khó đến mức nào. Dù cả hai đều là sản phẩm Microsoft, IT vẫn phải tìm cách thiết lập GitHub Enterprise, kết nối với subscription Azure và làm đủ thứ việc khác
Nếu từng dùng model AI để lập trình trong môi trường tập đoàn lớn thì bạn sẽ biết nhiều triển khai ở các công ty lớn thực tế gần như bắt buộc phải dùng AWS Bedrock. Lý do rất đơn giản
Chúng tôi không làm việc ở Mỹ, và có yêu cầu rất mạnh rằng dữ liệu phải ở lại trong nước; Bedrock cung cấp được quyền kiểm soát đó
Nếu xu hướng là như vậy thì tôi tự hỏi AI sẽ tiếp tục tăng trưởng ra sao trong tương lai. Nếu giả định phần lớn dữ liệu có giá trị nằm sau những bức tường lửa như thế này, thì dữ liệu công khai có lẽ đã bị khai thác gần hết, còn việc huấn luyện có thể đã dựa trên dữ liệu thu được bất hợp pháp. Chỗ này là vùng xám
Cuối cùng liệu nó có trở thành một hệ sinh thái khép kín không có đầu vào từ bên ngoài không?
Nếu bạn thắc mắc vì sao lại không dùng trực tiếp mà phải trả nhiều tiền hơn để đi qua AWS cho các API này, thì ở một số công ty, việc xin phê duyệt nhà cung cấp mới gần như là bất khả thi. Nếu công ty đã có hợp đồng với AWS thì phải dùng những gì AWS cung cấp
Tùy hợp đồng với khách hàng, có thể còn phải thông báo cho khách hàng về nhà cung cấp mới này, và việc đó có thể kích hoạt một vòng rà soát bảo mật mới. Nhưng nếu chỉ là thêm một model vào Bedrock thì sao? Dễ hơn rất nhiều
Đây là tin rất lớn với OpenAI. Có nhiều doanh nghiệp đã chọn Claude chỉ vì dùng được trên AWS hơn người ta tưởng rất nhiều, và giờ đây đã có cạnh tranh nghiêm túc
Đây là bước đi tốt cho OpenAI và là điều Anthropic nên lo. Trong một thời gian dài, vì phụ thuộc vào AWS và các yêu cầu bảo mật, Bedrock là cách duy nhất để tôi có thể dùng các foundation model
Có lẽ họ sẽ không vui khi lợi thế người đi trước biến mất, nhưng chắc cũng đã đoán trước điều này từ lâu
Đây là tin tốt cho cạnh tranh
Claude Code liên tục không đưa các tính năng mới cho người dùng qua Amazon Bedrock. Ví dụ như chế độ tự động, gói Ultra, hay Claude for Chrome. Nếu cạnh tranh tăng thêm một chút, có lẽ họ sẽ phải nghĩ lại chiến lược
Tôi đã tạo một trình mô phỏng api.anthropic.com trong một thời gian, để “lén” chuyển tiếp các request sang Amazon Bedrock. Nó hoạt động tốt, và giờ thậm chí có thể dùng ngay cả các tính năng vốn chỉ dành cho nhà cung cấp bên thứ nhất
Có vẻ Anthropic nên IPO sớm. Mức tăng trưởng doanh thu khổng lồ thực chất phần lớn là nhờ Gemini ra mắt thất bại và việc OpenAI bị trói vào Azure nên không xoay sở được
Các model của Anthropic theo đúng nghĩa đen là API serverless thực dụng duy nhất có thể dùng trên AWS, tức các model Bedrock. Gần đây họ thậm chí còn không phát hành dòng Qwen 3.5/3.6. Cộng thêm xu hướng tập trung vào hiệu quả token và ROI, tôi thật sự muốn xem Anthropic sẽ chốt quý 3 ra sao
Các frontier lab cung cấp những bản build model đã đóng băng để hyperscaler chỉ việc phục vụ mà không thu thập dữ liệu. Với đa số công ty muốn dùng frontier LLM mà vẫn lưu trữ dữ liệu nhạy cảm, đây là điều kiện tiên quyết
Đây là tin không hay cho Azure. Từng là kẻ được chọn, nhưng họ không theo kịp nhu cầu
Khi OpenAI rút khỏi thỏa thuận độc quyền với lý do Azure không ổn định, tôi đã biết điểm đến tiếp theo sẽ là AWS