2 điểm bởi GN⁺ 11 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Các mô hình frontier của OpenAI và Codex hiện đã chính thức có mặt trên AWS, cho phép hàng triệu khách hàng AWS xây dựng với OpenAI ngay trên nền tảng họ đang vận hành doanh nghiệp
  • Doanh nghiệp có thể đưa frontier AI vào production thông qua các quy trình bảo mật, tuân thủ, mua sắm, thanh toán và quản trị hiện có, giúp giảm ma sát từ giai đoạn đánh giá đến triển khai thực tế
  • OpenAI models on Amazon Bedrock cho phép xây dựng ứng dụng AI bằng các cơ chế bảo mật và kiểm soát quản trị gốc của AWS
  • Codex on Amazon Bedrock đưa tác nhân kỹ thuật phần mềm của OpenAI, hiện được hơn 5 triệu người dùng mỗi tuần, vào môi trường AWS để hỗ trợ viết mã, review, debug và hiện đại hóa mã nguồn
  • Trong tương lai, Daybreak sẽ được cung cấp cho khách hàng AWS, đưa review mã bảo mật, mô hình hóa mối đe dọa, xác minh bản vá, phân tích rủi ro phụ thuộc, phát hiện và hướng dẫn cải thiện vào vòng lặp phát triển hằng ngày

Đưa OpenAI vào production trên AWS

  • Các mô hình frontier của OpenAI và Codex hiện đã được cung cấp rộng rãi trên AWS
  • Khách hàng AWS có thể sử dụng các khả năng của OpenAI thông qua nền tảng AWS nơi họ đang vận hành doanh nghiệp
  • Những rào cản lớn của doanh nghiệp như bảo mật, tuân thủ, mua sắm, thanh toán và quy trình quản trị có thể được xử lý trong các workflow hiện có
  • Các tổ chức có thể giảm rào cản vận hành và chuyển nhanh hơn từ giai đoạn đánh giá sang triển khai thực tế

Cách cung cấp và kế hoạch mở rộng

  • OpenAI models on Amazon Bedrock cho phép tạo ứng dụng AI bằng các cơ chế bảo mật và kiểm soát quản trị gốc của AWS
  • Codex on Amazon Bedrock được cung cấp như một tác nhân kỹ thuật phần mềm hỗ trợ các nhóm viết mã, review, debug và hiện đại hóa trong môi trường AWS nơi họ đã xây dựng và triển khai
  • Cả hai hình thức cung cấp đều có thể sử dụng tại các region AWS Commercial và GovCloud
  • OpenAI và AWS có kế hoạch tiếp tục mở rộng các khả năng của OpenAI được cung cấp thông qua AWS để giúp các nhóm chuyển từ đánh giá sang production với ít ma sát hơn và mức độ tin cậy cao hơn
  • Daybreak, sẽ được cung cấp trong tương lai, bao gồm cyber model và Codex Security, được thiết kế để giúp các đội phòng thủ an ninh mạng nhìn thấy rủi ro sớm hơn, phản ứng nhanh hơn và làm cho phần mềm có khả năng chống chịu tốt hơn

1 bình luận

 
Ý kiến trên Hacker News
  • Mỗi lần thấy ai đó hỏi vì sao lại tin tưởng AWS, Azure hay GCP và vì sao lại chịu trả premium cho chúng, tôi lại nghĩ là người đó chưa từng làm trong môi trường doanh nghiệp
    Tập đoàn lớn nơi tôi làm việc có các điều khoản quản trị dữ liệu rất nghiêm ngặt trong hợp đồng với khách hàng, đồng thời cũng có các yêu cầu quản trị nội bộ riêng. Cách để tránh bị sa thải và bị kiện là chỉ dùng những nhà cung cấp không chỉ đã được phê duyệt về an ninh thông tin mà còn được nêu rõ là bên xử lý dữ liệu trong hợp đồng khách hàng
    Ở nhà thì bạn có thể làm gì cũng được với code và dữ liệu của mình, nhưng với dữ liệu công ty và dữ liệu khách hàng thì tuyệt đối không. Lý do không thể tùy tiện dùng bất kỳ mô hình frontier mới đang thịnh hành nào cũng y như vậy. Dự án cá nhân và startup có các ràng buộc và yếu tố cần cân nhắc hoàn toàn khác

    • Tôi tò mò không biết bạn đã từng xem hợp đồng AWS thực tế và phần trách nhiệm giới hạn được nêu trong hợp đồng cũng như các tài liệu được liên kết từ tài liệu hợp đồng và marketing chưa
      Đọc phần chữ nhỏ khá thú vị đấy. Trách nhiệm đối với mất mát dữ liệu phần lớn thuộc về khách hàng, các yêu cầu bồi thường theo SLA phải đưa ra bằng chứng cụ thể, và biện pháp khắc phục được chấp nhận thường chỉ là tín dụng sử dụng trong tương lai cho đúng sản phẩm đã làm mất dữ liệu
      Điều khoản của AWS thực ra còn khá hợp lý nếu so với những nơi như GCP. SLA của GCP có vẻ chủ yếu hữu ích để đội mua sắm doanh nghiệp nói rằng “vì có SLA nên chúng tôi đã thẩm định rồi, chọn cái này chắc sẽ không bị sa thải.” Trong khi đó GCP có thể nói “khi ký hợp đồng bạn đã chấp nhận biện pháp khắc phục được đề xuất rồi, nên nếu kiện chúng tôi sẽ chỉ vào điều khoản đó thôi. Cảm ơn vì đã tin tưởng.” [0]
      [0] https://docs.cloud.google.com/storage/docs/storage-classes
      Lưu trữ Standard đa vùng hoặc hai vùng có SLA khả dụng 99.95%, Standard theo vùng là 99.9%, còn Nearline, Coldline, Archive theo vùng có thể xuống tới 99.0%. Tín dụng là 10%, 25%, 50% trên hóa đơn tháng của tầng dịch vụ bị ảnh hưởng, tổng mức trần cộng dồn theo tháng là 50% và được áp dụng cho việc sử dụng trong tương lai. Google cũng nói rằng nếu khách hàng không yêu cầu tín dụng trong vòng 30 ngày thì sẽ bị coi là từ bỏ quyền đó
    • Ngoài ra còn có khác biệt rất lớn giữa “nhóm kia đã tiêu 1.000 đô la cho AI trong báo cáo chi phí, thế họ thu được gì vậy?” và “hóa đơn AWS toàn công ty tăng thêm vài phần trăm rồi, lúc nào rảnh hãy xem nhé.” Trường hợp sau khiến dự án khả thi hơn nhiều trong thực tế
    • Tư thế bảo mật của AWS là khác. Các startup AI, công cụ dựng web cho startup, hay nhà cung cấp plugin VSCode rất dễ bị hack và rò rỉ dữ liệu
      AWS cũng có thể bị hack, nhưng họ đã chú trọng giảm phần nào khả năng đó và giúp việc truy vết khách hàng nào bị ảnh hưởng trở nên dễ hơn. Ví dụ, nếu đào sâu vào logging của AWS thì chỉ cần bật lên thôi cũng có cực nhiều bản ghi, đủ để lần lại ai đã làm gì với quyền hạn hay môi trường nào. Có lẽ việc truy cập của nhân viên AWS cũng được ghi lại khá đầy đủ. Trước đây để gắn một nhân viên AWS vào tài khoản của tôi còn phải qua nhiều thủ tục
    • Nói ngắn gọn thì đây là kiểu không ai bị sa thải vì chọn IBM
    • Tôi vừa chuyển từ một môi trường tự do, nơi có thể dùng bất kỳ AI harness hay model nào, sang một môi trường doanh nghiệp bị kiểm soát nghiêm ngặt
      Tôi thật sự sốc khi biết việc dùng một giấy phép GitHub Copilot trên Azure lại khó đến mức nào. Dù cả hai đều là sản phẩm Microsoft, IT vẫn phải tìm cách thiết lập GitHub Enterprise, kết nối với subscription Azure và làm đủ thứ việc khác
  • Nếu từng dùng model AI để lập trình trong môi trường tập đoàn lớn thì bạn sẽ biết nhiều triển khai ở các công ty lớn thực tế gần như bắt buộc phải dùng AWS Bedrock. Lý do rất đơn giản

    1. Các tập đoàn lớn thường đã có quan hệ với AWS, nên quy trình dễ hơn rất nhiều so với việc tạo quan hệ với nhà cung cấp mới
    2. Các tập đoàn lớn thường có yêu cầu nội bộ rất mạnh rằng dữ liệu nội bộ phải nằm dưới sự kiểm soát của công ty. Dùng AWS Bedrock thì có thể tự tin hơn nhiều rằng những gì đưa vào model sẽ không trôi vào một bộ dữ liệu huấn luyện nào đó. Ở nơi tôi làm, vì yêu cầu này nên việc đi qua AWS Bedrock thay vì dùng trực tiếp OpenAI API là điều bắt buộc
    • Đi sâu thêm một bước thì lý do việc thêm nhà cung cấp mới thường bất khả thi là vì trong nhiều hợp đồng với khách hàng, công ty đã cam kết dưới nhiều hình thức rằng sẽ không gửi dữ liệu khách hàng sang nhà cung cấp khác
    • Với nhiều LLM, Bedrock cho phép kiểm soát dữ liệu sẽ ở lại quốc gia nào. Ví dụ với Claude API thì không có kiểu kiểm soát đó
      Chúng tôi không làm việc ở Mỹ, và có yêu cầu rất mạnh rằng dữ liệu phải ở lại trong nước; Bedrock cung cấp được quyền kiểm soát đó
    • Câu chuyện này khá thú vị
      Nếu xu hướng là như vậy thì tôi tự hỏi AI sẽ tiếp tục tăng trưởng ra sao trong tương lai. Nếu giả định phần lớn dữ liệu có giá trị nằm sau những bức tường lửa như thế này, thì dữ liệu công khai có lẽ đã bị khai thác gần hết, còn việc huấn luyện có thể đã dựa trên dữ liệu thu được bất hợp pháp. Chỗ này là vùng xám
      Cuối cùng liệu nó có trở thành một hệ sinh thái khép kín không có đầu vào từ bên ngoài không?
    • Tôi tò mò làm sao có thể chắc chắn rằng dữ liệu Bedrock không bị chuyển sang nhà cung cấp bên ngoài
  • Nếu bạn thắc mắc vì sao lại không dùng trực tiếp mà phải trả nhiều tiền hơn để đi qua AWS cho các API này, thì ở một số công ty, việc xin phê duyệt nhà cung cấp mới gần như là bất khả thi. Nếu công ty đã có hợp đồng với AWS thì phải dùng những gì AWS cung cấp

    • Khoan, vậy AWS đang bán lại quyền truy cập máy chủ của một công ty AI nào đó, hay là AWS chạy các model đó trên phần cứng của chính mình?
    • Dù có thể được phê duyệt đi nữa, phạm vi của cuộc kiểm toán bảo mật hằng năm cũng sẽ rộng hơn, sẽ có thêm một nhà cung cấp phải công bố trong đánh giá bảo mật, dữ liệu sẽ lại lan sang thêm một bên xử lý khác, và cũng sẽ phát sinh thêm một hóa đơn cùng một cuộc thảo luận ngân sách nữa
      Tùy hợp đồng với khách hàng, có thể còn phải thông báo cho khách hàng về nhà cung cấp mới này, và việc đó có thể kích hoạt một vòng rà soát bảo mật mới. Nhưng nếu chỉ là thêm một model vào Bedrock thì sao? Dễ hơn rất nhiều
    • CEO, hội đồng quản trị và quản lý cấp trung trên khắp thế giới giờ đều bị ám ảnh bởi từ khóa AI. Nếu yêu cầu ký trực tiếp với một frontier lab thì có vẻ khó mà thực sự bị chặn lắm nhỉ?
  • Đây là tin rất lớn với OpenAI. Có nhiều doanh nghiệp đã chọn Claude chỉ vì dùng được trên AWS hơn người ta tưởng rất nhiều, và giờ đây đã có cạnh tranh nghiêm túc

  • Đây là bước đi tốt cho OpenAI và là điều Anthropic nên lo. Trong một thời gian dài, vì phụ thuộc vào AWS và các yêu cầu bảo mật, Bedrock là cách duy nhất để tôi có thể dùng các foundation model

    • Claude vốn đã được cung cấp cả theo kiểu đi qua máy chủ Anthropic từ AWS lẫn qua Bedrock. https://aws.amazon.com/claude-platform/
      Có lẽ họ sẽ không vui khi lợi thế người đi trước biến mất, nhưng chắc cũng đã đoán trước điều này từ lâu
  • Đây là tin tốt cho cạnh tranh
    Claude Code liên tục không đưa các tính năng mới cho người dùng qua Amazon Bedrock. Ví dụ như chế độ tự động, gói Ultra, hay Claude for Chrome. Nếu cạnh tranh tăng thêm một chút, có lẽ họ sẽ phải nghĩ lại chiến lược

    • Điều kỳ lạ là các model Claude trên Amazon Bedrock lại hỗ trợ đầy đủ các tính năng đó
      Tôi đã tạo một trình mô phỏng api.anthropic.com trong một thời gian, để “lén” chuyển tiếp các request sang Amazon Bedrock. Nó hoạt động tốt, và giờ thậm chí có thể dùng ngay cả các tính năng vốn chỉ dành cho nhà cung cấp bên thứ nhất
    • Giờ chế độ tự động cũng hoạt động trên Bedrock rồi
  • Có vẻ Anthropic nên IPO sớm. Mức tăng trưởng doanh thu khổng lồ thực chất phần lớn là nhờ Gemini ra mắt thất bại và việc OpenAI bị trói vào Azure nên không xoay sở được
    Các model của Anthropic theo đúng nghĩa đen là API serverless thực dụng duy nhất có thể dùng trên AWS, tức các model Bedrock. Gần đây họ thậm chí còn không phát hành dòng Qwen 3.5/3.6. Cộng thêm xu hướng tập trung vào hiệu quả token và ROI, tôi thật sự muốn xem Anthropic sẽ chốt quý 3 ra sao

  • Các frontier lab cung cấp những bản build model đã đóng băng để hyperscaler chỉ việc phục vụ mà không thu thập dữ liệu. Với đa số công ty muốn dùng frontier LLM mà vẫn lưu trữ dữ liệu nhạy cảm, đây là điều kiện tiên quyết

  • Đây là tin không hay cho Azure. Từng là kẻ được chọn, nhưng họ không theo kịp nhu cầu
    Khi OpenAI rút khỏi thỏa thuận độc quyền với lý do Azure không ổn định, tôi đã biết điểm đến tiếp theo sẽ là AWS