1 điểm bởi GN⁺ 2 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Chỉ số cốt lõi của cuộc đua AI là thương mại hóa; sau khi DeepSeek R1 gây chấn động thị trường vào tháng 1/2025, OpenAI và Anthropic đã thương mại hóa agents, Codex và Claude Code nhanh hơn
  • Giá trị chiến lược của DeepSeek tại Trung Quốc nằm ở việc giảm phụ thuộc vào Nvidia và chuyển suy luận sang các stack nội địa như Huawei Ascend, hơn là doanh thu
  • Châu Âu đã chi khoảng 58,8 tỷ USD cho dịch vụ phần mềm của Ấn Độ trong FY 2023~2024, và khoảng 67,1 tỷ USD vào năm sau đó, nhưng chỉ riêng mô hình thì không tạo ra đủ giá trị
  • Chi phí điện năng rẻ cũng quan trọng, nhưng phạm vi tiếp cận về đám mây và dữ liệu của AWS·Azure·Google Cloud cùng YouTube·Microsoft 365·GitHub mới mang tính quyết định hơn
  • AI bị vũ khí hóa và các mô hình an ninh mạng frontier như Mythos của Anthropic có thể đẩy các quốc gia và doanh nghiệp quốc phòng về phía stack đóng và bảo mật bằng che giấu

Mỹ đang dẫn trước ở đâu

  • Thương mại hóa là chỉ số cốt lõi của cuộc đua AI, và sau khi DeepSeek R1 gây chấn động thị trường vào tháng 1/2025, các công ty Mỹ đã di chuyển nhanh hơn
    • OpenAI đẩy mạnh agents và Codex hơn nữa, còn Anthropic thì thương mại hóa Claude Code
    • Trung Quốc cũng có đối thủ cạnh tranh, nhưng về doanh thu, mức độ triển khai, công cụ và độ phủ, Mỹ đang dẫn trước
  • Giá trị chiến lược của DeepSeek tại Trung Quốc nằm ở việc giảm phụ thuộc vào Nvidia và chuyển suy luận sang các stack nội địa như Huawei Ascend, hơn là thành tích thương mại
    • Điều này hỗ trợ quyền tự chủ chuỗi cung ứng, nhưng là một vấn đề khác với năng lực dẫn đầu AI có lợi nhuận
  • Christian Klein của SAP cho rằng châu Âu không cần thêm nhiều trung tâm dữ liệu và chỉ riêng các mô hình ngôn ngữ lớn là không đủ; trên thực tế, chỉ mô hình thôi là chưa đủ
    • Châu Âu đã chi khoảng 58,8 tỷ USD cho dịch vụ phần mềm của Ấn Độ trong FY 2023~2024, và khoảng 67,1 tỷ USD vào năm sau đó
    • AI chỉ tạo ra giá trị khi được gắn với dữ liệu thực, quy trình công việc thực và sản phẩm thực
    • Mỹ đang đồng thời xây dựng chip, điện năng, trung tâm dữ liệu, nền tảng đám mây, công cụ cho nhà phát triển, nền tảng người tiêu dùng và phần mềm doanh nghiệp, nên lợi thế ngày càng lớn
  • Số lượng bài báo hay số lượng kỹ sư không chứng minh được vị thế dẫn đầu AI
    • Bài kiểm tra then chốt là khả năng huy động vốn cho hạ tầng, huấn luyện và phục vụ các mô hình quy mô lớn, cũng như năng lực đưa AI vào toàn bộ nền kinh tế

Sức mạnh của đám mây và dữ liệu còn lớn hơn điện năng

  • Chi phí điện năng quan trọng vì các hệ thống GPU và TPU hiện đại biến điện thành năng lực tính toán, và điện rẻ giúp hạ chi phí mô hình
    • Khi so sánh giá điện, Mỹ rẻ hơn các nền kinh tế lớn ở Tây Âu, còn Canada còn rẻ hơn Mỹ
    • Trung Quốc và Nga có chi phí thấp hơn Mỹ trong phép so sánh này
    • Giá điện dân dụng/doanh nghiệp lần lượt là Đức 0.436/0.279, Anh 0.420/0.415, Tây Ban Nha 0.282/0.136, Pháp 0.274/0.174, Mỹ 0.201/0.154, Canada 0.125/0.106, Nga 0.087/0.131, Trung Quốc 0.078/0.117
  • Hạ tầng đám mây và dữ liệu là tầng quyết định hơn cả điện năng
    • Mỹ có thể triển khai các mô hình của doanh nghiệp Mỹ ra toàn cầu thông qua các hyperscaler toàn cầu là AWS, Azure và Google Cloud
    • YouTube là một kho ngữ liệu video, Google Drive và Microsoft 365 nằm trong công việc văn phòng hằng ngày, còn GitHub hiện diện ngay trong hoạt động phát triển phần mềm
    • Chúng vừa là hệ thống phân phối vừa là nền tảng dữ liệu, cho phép đưa các mô hình mới vào những sản phẩm mà mọi người dùng mỗi ngày
  • Chỉ điện rẻ thôi thì khó có thể thắng trong cuộc đua AI
    • Nếu không có quy mô đám mây, độ phủ nền tảng, hệ sinh thái nhà phát triển và quyền tiếp cận các luồng dữ liệu lớn hữu ích, thì dù chi phí điện thấp vẫn có thể thua
    • Mỹ có đồng thời các yếu tố này, Trung Quốc có phần lớn trong số đó trong thị trường nội địa lớn của mình, còn châu Âu thì không
  • Châu Âu từ lâu đã sở hữu nguồn nhân lực kỹ thuật mạnh, nhưng chỉ nhân tài thôi là chưa đủ
    • Các hyperscaler của Mỹ đã thống trị thị trường, nên để đuổi kịp sẽ mất rất nhiều thời gian
    • Ngay cả khi châu Âu bây giờ thực sự rót vốn vào một nhà vô địch đám mây, việc xây hạ tầng cũng chỉ là bước đầu; sau đó còn phải chuyển các ngân hàng, nhà sản xuất và cơ quan công quyền sang nền tảng đó
    • Quá trình này có thể mất gần 10 năm, và trong thời gian đó AWS, Azure và Google Cloud sẽ còn đi xa hơn về quy mô, phần mềm và dữ liệu
    • Arkady Volozh đang cố biến Nebius thành một công ty hạ tầng AI của châu Âu, nhưng châu Âu vẫn còn gần như ở vạch xuất phát
  • AI bị vũ khí hóa cũng là một mặt trận khác
    • Bước tiếp theo có thể là việc AI của quốc gia này đối đầu với AI của quốc gia khác trong các mạng bot, chiến dịch mạng và vũ khí tự động
    • Không khó để tinh chỉnh hệ thống nhằm phi nhân hóa đối thủ, biện minh cho bạo lực hoặc nhắm mục tiêu vào toàn bộ nhóm dân số
    • Khi mô hình được nhúng vào truyền thông, mạng lưới và vũ khí, thiên kiến sẽ biến thành sức mạnh, và cuộc đua AI cũng là một cuộc đua an ninh
  • Các mô hình như Mythos của Anthropic có thể đẩy các quốc gia và doanh nghiệp quốc phòng sang một hướng khác
    • Trực giác kiểu Linux lâu nay là càng nhiều người nhìn vào mã nguồn mở thì càng tốt, nhưng các mô hình an ninh mạng frontier có thể tạo ra lập luận ngược lại
    • Có thể sẽ dịch chuyển về phía bảo mật bằng che giấu thông qua phần mềm đóng, công cụ đóng, firmware đóng và chip đóng
    • Nếu mô hình không thể học từ mã và kiến trúc của stack mục tiêu thì thông thường ngữ cảnh và tốc độ sẽ giảm đi
    • Điều đó không làm hệ thống trở nên an toàn, nhưng lại làm tăng giá trị của các stack độc quyền kéo dài tới tận phần cứng

1 bình luận

 
Ý kiến trên Hacker News
  • Anthropic, OpenAI, Google đúng là nổi bật, nhưng câu hỏi lớn hơn là tại sao lại gọi đây là chiến tranh
    Trung Quốc đã hưởng lợi lớn trong bối cảnh của riêng mình, đồng thời cũng tăng cường năng lực thiết kế và sản xuất GPU
    Nếu thật sự là chiến tranh, thì Trump đang tự cản trở đất nước mình bằng việc làm suy yếu pháp quyền và làm giảm thiện cảm với Mỹ. Nếu thế giới cảm thấy khó giao dữ liệu cho Trung Quốc, nhưng cũng không thể tin Mỹ sẽ cung cấp dịch vụ ổn định, thì dù thắng trong cuộc chiến AI, lợi ích quay về với Mỹ cũng có thể bị hạn chế
    Ngược lại, đây có thể là điều tốt cho những khu vực có thể xây dựng stack công nghệ riêng như Europe, và vì stack AI quá đắt đỏ nên các mô hình mã nguồn mở mạnh của Trung Quốc lại tạo ra một cục diện kỳ lạ là có ích cho thế giới hơn Mỹ

    • Câu trả lời cho việc “tại sao là chiến tranh” là vì đằng sau nó có lời hứa được cường điệu rằng tổ chức nào chạm đến AGI, thứ hiện vẫn gần với lý thuyết, trước tiên sẽ tự bootstrap lên đến mức có năng lực như thần thánh và dựng lên một Planetary Overlord để thống trị thế giới
      Tôi thấy đó là ý tưởng vô lý, nhưng động lực liên quan thì nằm ở phía đó. Cụm từ này do tác giả SF Charles Stross tạo ra trong The Jennifer Morgue (2006)
    • Vì Mỹ không thể tưởng tượng theo cách khác. Mọi thứ đều là chiến tranh, và Mỹ lúc nào cũng phải thắng
    • Nó trở thành chiến tranh vì các nhà đầu tư muốn độc chiếm thị trường. Đó vốn là việc họ làm, và sau này họ cũng sẽ luôn muốn như vậy
    • Tiêu đề đã bị đổi à? Bây giờ ghi là race chứ không phải ‘war’
    • Từ chiến tranh rốt cuộc xuất phát từ nỗi lo rằng nếu đạt tới điểm kỳ dị thì người ta có thể thoát khỏi các giới hạn ở quy mô con người và áp đảo những kẻ còn lại
      Dù làm ra khẩu súng tốt hơn thì số người có thể cầm nó vẫn có hạn, nên không thể chinh phục thế giới theo cách đó. Nhưng nếu ai đó phát minh ra siêu trí tuệ, họ có thể nhanh chóng thống trị nghiên cứu AI mới, kiểm soát kinh tế thế giới và chiến đấu tốt hơn rất nhiều
  • Tôi đã báo cáo đây là nội dung do AI tạo ra. Bài này không nên nằm ở front page, và nhìn vào lịch sử bài đăng và bình luận của người gửi thì có vẻ cần bị xử lý
    Với tuyên bố rằng “Mỹ đang thắng ở thương mại hóa, lĩnh vực quan trọng nhất trong cuộc đua AI”, thì tiêu chí thắng có thể có nhiều kiểu và thương mại hóa không phải thứ đầu tiên tôi nghĩ đến
    https://english.www.gov.cn/news/202604/15/content_WS69df29e6...
    https://fortune.com/2026/05/03/chinese-court-layoffs-workers...
    https://www.reuters.com/world/china/china-moves-regulate-dig...
    Lập luận rằng YouTube, Google Drive, Microsoft 365, GitHub là những nền tảng tạo ra và sắp xếp dữ liệu của thời đại AI cũng không thuyết phục. Nghe như thể Trung Quốc không có nền tảng lẫn dữ liệu vậy

    • Theo tiêu chí của Pangram thì đây hoàn toàn là bài viết do AI tạo ra
      Sẽ tốt nếu có quy định buộc phải công khai hoặc xóa văn bản do LLM tạo ra. Cả blog này nhìn cũng giống như toàn bộ đều do AI tạo
    • Nhận xét rất đúng. Tôi còn ngần ngại không muốn gọi nó là một bài viết khủng khiếp, nhưng thực tế đúng là vậy
    • Ước gì có thể chặn một người dùng cụ thể để khỏi thấy bài của họ. Nếu không có những người như OP thì front page sẽ tốt hơn nhiều
  • Tôi không hiểu kiểu nói năng lảm nhảm này sao lại nổi trên HN được. Văn hóa HN đã thay đổi thế nào mà thứ như vậy có thể leo lên top

    • https://paulgraham.com/submarine.html
    • Đây là một trang mà ai cũng có thể tạo nhiều tài khoản trong vài phút, và cơ chế chống lạm dụng thì tối thiểu
      Sức mạnh của cộng đồng này hoàn toàn dựa vào việc nó ít được biết đến, nhưng giờ thì không còn như vậy nữa. Khoảnh khắc nó đủ lớn để bị dùng như một nền tảng tuyên truyền chính trị, thì với tư cách một không gian của giới trí thức nó đã chết rồi
    • Dù bài gửi lên không hay, tiền đề cốt lõi vẫn có thể đáng để thảo luận
      Nói thêm là tôi không vote cho bài này
    • Có vẻ là vì nhiều người không đọc nội dung mà chỉ nhìn tiêu đề rồi upvote
      Tiêu đề khá câu kéo, nhưng nội dung là thứ rác rưởi chất lượng thấp do máy sinh ra
    • Ở HN hay ở đâu cũng vậy, những bài vô nghĩa vẫn thường nổi lên
      Cuộc nổi dậy của quần chúng là có thật
  • Không, Mỹ chỉ đang dẫn trước trong cuộc đua AI thôi, chứ cuộc đua chưa kết thúc
    Nếu dẫn trước ở đoạn 90% rồi đến cuối lại trượt chân vì chính mồ hôi của mình thì có ý nghĩa gì. Dù đổ hàng chục tỷ đô để có được công nghệ AI tốt nhất bằng mọi giá, nếu đối thủ có thể chưng cất tiến bộ đó rồi bắt kịp trong 6–12 tháng với chỉ 1% chi phí thì ý nghĩa cũng giảm đi nhiều
    Ngay cả ở thương mại hóa, thứ mà bài viết coi trọng, Mỹ cũng bắt đầu mất thị phần. Gần đây tôi thấy người ta chuyển từ gói cc/codex sang gói glm/opencode khi các công ty Mỹ siết mức sử dụng trong gói thuê bao. Nếu xu hướng này cố định lại, các công ty Mỹ sẽ gặp rắc rối. Không phải ai cũng cần mô hình tối tân nhất; nhiều người chỉ muốn trả 20 đô mỗi tháng để dùng một mô hình khá ổn

    • Nếu không phải thắng-thua hết phần thì sao? Nếu ngay từ đầu đã không có cạnh tranh thì sao? Nếu thứ Mỹ đang làm chỉ là đốt tiền bằng nợ có thể không bền vững và định giá bị thổi phồng quá mức thì sao?
      Cũng có thể xảy ra kịch bản AI trở thành như năng lực máy chủ phổ thông. Nếu khách hàng vẫn sống tốt mà không cần các hyperscaler, thì toàn bộ thị trường hiện tại có thể sẽ trông khá ngớ ngẩn
    • Nếu ai đó nói một đội bóng đang thắng trong hiệp một, bạn có đáp lại rằng “không, họ không thắng, họ chỉ đang dẫn trước thôi” không
    • Việc dẫn trước chỉ có ý nghĩa nếu đó là thị trường thắng làm vua. Nhưng AI không thể là thị trường kiểu đó vì lý do an ninh quốc gia
      Tôi nghĩ AI càng tốt thì càng dễ bị thay thế. Nó có thể trở thành thứ có giá trị như điện. Nhiều công ty kiếm tiền từ điện, nhưng không ở mức mà các nhà đầu tư hiện giờ đang kỳ vọng
    • Mark Cuban trong một cuộc phỏng vấn gần đây đã nói rằng các công ty sợ cuối cùng chỉ còn lại một bên. Tương tự như hiện nay thực tế chỉ có một công ty quảng cáo internet thống trị, ai cũng muốn trở thành kẻ đó
      Liệu có thật sự chỉ còn một bên hay không thì vẫn còn tranh cãi, nhưng theo Cuban thì ít nhất họ đang hành động với tư duy như vậy
  • Ngày xưa còn có cái gọi là lợi nhuận, còn có lợi tức đầu tư
    Nếu chiến lược thoái vốn là bán lại cho Google thì tập trung vào doanh thu cũng là chiến lược ổn. Nhưng nếu chính bạn là Google thì số tiền đã đổ vào cuối cùng phải thu hồi được. Có vẻ chúng ta đã quên điều đó
    Mức độ thương mại hóa hiện tại chỉ có nghĩa là Mỹ đang đốt tiền đầu tư nhanh hơn bất kỳ ai khác. Có thể một ngày nào đó điều này thay đổi và cú đặt cược thành công, nhưng mỗi phút tình trạng này kéo dài thêm thì lợi nhuận kỳ vọng phải tăng đủ để bù cả khoản lỗ của phút đó lẫn lãi của các khoảng thời gian trước. Tôi không chắc đó có phải là hình ảnh của việc “đang thắng” hay không. TikTok

  • Người thắng cuộc dài hạn sẽ là bên cung cấp hiệu năng tốt nhất với tỷ lệ dùng bộ nhớ thấp nhất trong mô hình local
    Anthropic, OpenAI, Mistral hiện chỉ là những công ty đang kiếm tiền, nhưng vẫn chưa có lợi nhuận và về dài hạn sẽ mất đà lẫn giá trị
    Dù vậy, điều thú vị hơn là gói thuê bao OpenCode Go rồi sẽ ra sao. Nó rẻ hơn Big Tech, có nhiều token hơn, và nói rằng đang cố cải thiện mà không dùng dữ liệu của chúng ta để huấn luyện

    • Claude tốt là nhờ dùng học tăng cường trên lịch sử chat và các trường hợp sử dụng của người dùng, nên việc không huấn luyện trên dữ liệu đó không phải ưu điểm mà là nhược điểm
      Thời kỳ chỉ huấn luyện bằng dữ liệu công khai thuần túy đã qua rồi. Ai cũng có thể tiếp cận dữ liệu đó, nhưng chỉ có vài mô hình ở tuyến đầu
    • Mô hình local không thể cạnh tranh với các mô hình lớn mới nhất. Cũng như iPhone không cạnh tranh với siêu máy tính chạy mô phỏng hạt nhân
      Hai con đường này sẽ tách ra. Chi phí chạy mô hình tuyến đầu sẽ đắt đến mức cuối cùng có thể bị khóa lại, chỉ còn các tác nhân cấp quốc gia mới tiếp cận được. Trong Mythos điều đó đã bắt đầu rồi
    • Mistral à? “Doanh thu” đó có vẻ chỉ bằng khoảng 1/150 của OpenAI và Anthropic
  • Tôi nghĩ cách giải thích đơn giản nhất cho việc Mỹ đang thắng là vì họ đang đổ vào nhiều tiền nhất. Mà là hơn hẳn luôn

    • Không chỉ là đổ tiền, mà gần như là in tiền rồi nhét vào
      Các giấy ghi nợ tuần hoàn giữa công ty AI và hyperscaler là nợ, tức một dạng tạo tiền. Dĩ nhiên vẫn có rất nhiều đô la khác chảy vào, nhưng đầu tư bằng số tiền vốn không tồn tại luôn là rủi ro cực lớn
    • Có thể tôi hiểu chưa đúng về chủ nghĩa tư bản, nhưng chẳng phải lẽ ra là “bên tạo ra nhiều lợi nhuận nhất sẽ thắng” sao? Nếu chỉ tiêu tiền là thắng thì có lẽ phải chỉnh lại các tham số của thị trường tư bản
  • Không, không phải Mỹ đang thắng. Chỉ là ở phương Tây, việc dùng mô hình Trung Quốc cho công việc bị cấm nên mới trông như vậy thôi

    • Đúng vậy. Nhiều người không biết rằng GLM 5.1 và Kimi 2.6 thực sự đã ở mức rất gần các mô hình tuyến đầu. Còn có Minimax 2.7, DeepSeek 4, Qwen, Xiaomi 2.5 Pro nữa
      Trung Quốc đang dẫn trước ở các mô hình tuyến đầu mã nguồn mở, nên tôi không rõ Mỹ thắng cuộc đua này ở chỗ nào. Đến một lúc nào đó, công ty và cá nhân sẽ bắt đầu chạy mô hình riêng của họ trên cloud và local, và mô hình Trung Quốc sẽ có mặt khắp nơi
    • Theo tôi hiểu thì cái bị cấm không phải là mô hình mà là nền tảng
      Ví dụ tự host rồi chạy deepseek-r1-distill-qwen-7b thì không sao. Nhưng tải ứng dụng DeepSeek rồi chạy nó trên thiết bị làm việc thì bên đặt ra các lệnh cấm này sẽ không chấp nhận
    • Vì các mô hình được host ở Trung Quốc không được tin tưởng. Điều này cũng là một phần 100% của thương mại hóa
    • Có bằng chứng chắc chắn nào cho thấy các mô hình này có thể vượt mô hình phương Tây về chất lượng không? Hay đúng hơn là vì bị cấm nên chúng khó cạnh tranh do không thể có đủ dữ liệu huấn luyện và độ hiện diện?
    • Ý là nếu những thứ như qwen được dùng rộng hơn thì vị thế chiến lược của Mỹ sẽ thay đổi sao? Mỹ vẫn có các mô hình tốt nhất, đồng thời cũng sở hữu các công ty xây dựng hạ tầng và hyperscaler tốt nhất
      Chuyện “giờ có thể dùng Qwen rồi à?” có vẻ không đến mức giáng đòn lớn vào Mỹ
  • Nhìn từ xa thì lập luận này không hợp lý. Anthropic, OpenAI, xAI, Google, Meta, Microsoft đều không có lãi ở mảng AI, mà đang sống nhờ tiền công ty mẹ hoặc tiền nhà đầu tư, đặc biệt là tiền nhà đầu tư, trong khi tiếp tục thua lỗ
    Các mô hình Trung Quốc thì đang bắt kịp họ, lại còn cung cấp mô hình miễn phí, chạy được trên phần cứng cấp tiêu dùng, và quan trọng hơn là huấn luyện rẻ hơn. Mô hình AI là sản phẩm có biến động cực lớn, có thể lỗi thời chỉ trong vài tuần. Cuối cùng bạn cứ phải tiếp tục đổ tài nguyên vào việc làm mô hình tốt hơn, trong tình trạng mục tiêu duy nhất ngoài việc mở rộng vô hạn dường như không có gì khác
    Hành vi thực tế của người dùng chỉ đơn giản là “Gemini tệ hơn Claude ở XYZ nên tôi không dùng”. Nếu mô hình Gemini tệ hơn nữa thì người dùng chuyển sang Anthropic. Vậy nếu đến lượt mô hình Anthropic tệ hơn các bên khác thì sao? Nếu sản phẩm khách quan là kém hơn thì thương mại hóa giỏi đến mấy có ý nghĩa gì
    Tôi hiểu việc Mỹ thống trị phân phối, tích hợp, hợp đồng doanh nghiệp, hệ sinh thái và hạ tầng. Bài viết không hẳn sai, nhưng sự thống trị đó mong manh và đòi hỏi nâng cấp liên tục
    Nếu đối thủ lúc nào cũng bám ngay phía sau để chờ vượt lên mà bạn lại phải mở rộng vô hạn, thì điều đó có ý nghĩa gì. Mở rộng vô hạn là không thể, và tiền VC đến lúc nào đó sẽ cạn. Khi đó ai cũng sẽ phải co lại để gánh nổi chi phí thực của mô hình mới nhất, và phải bù đắp khoản chi khổng lồ ấy bằng thuê bao hoặc cách kiếm tiền khác. Ta đã thấy SORA bị dừng vì đốt tiền quá nhanh, trong khi Trung Quốc liên tục tung ra các mô hình video vượt trội hơn nhiều
    Việc tích hợp mô hình vào sản phẩm khác cũng là điểm cốt lõi, và ở mảng này mã nguồn mở cũng đang bám theo, thậm chí có khả năng cuối cùng vượt lên khi tiền VC cạn đi

    • Đoạn “không có lãi ở mảng AI” cần có căn cứ
      Theo các báo cáo, họ có lãi ở phía suy luận, còn tiền VC được dùng để xây thêm data center nhằm chạy nhiều suy luận hơn. Các mô hình thuê bao cho coding có thể trung bình chỉ ở mức hòa vốn, nhưng tiền nằm ở API
      Tuyên bố rằng mô hình Trung Quốc chạy trên phần cứng cấp tiêu dùng cũng bị phóng đại. Không ai chạy một mô hình 1.6T token như DeepSeek v4 trên phần cứng tiêu dùng cả
      Chi phí huấn luyện cũng không rẻ hơn mô hình Mỹ quá nhiều. Big Tech Trung Quốc đang trợ cấp việc huấn luyện, và đó là lý do nó rẻ hơn đôi chút so với các lab tuyến đầu của Mỹ đang huấn luyện mô hình 5T·10T lớn và mạnh hơn. Các lab Mỹ cũng chi tiền cho dữ liệu học tăng cường đa dạng hơn, và khác biệt đó thể hiện qua hiệu năng trên nhiều benchmark
      Trường hợp Sora thực ra lại chứng minh luận điểm của bài viết. OpenAI không dừng Sora; họ chỉ đóng phiên bản thuê bao và mạng xã hội kỳ quặc kia, còn API thì vẫn truy cập được
      Các mô hình video Trung Quốc cũng là mô hình API, và giống như LLM đang có khả năng sinh lời với các lab tuyến đầu của Mỹ, chúng cũng có khả năng sinh lời với phía Trung Quốc. Giá mô hình video có ở [1], biên độ khá lớn nhưng Google Veo và OpenAI Sora có mức giá tương tự các mô hình Trung Quốc
      [1] https://openrouter.ai/models?output_modalities=video
    • Nếu các mô hình Trung Quốc không thể chưng cất từ các mô hình lớn hơn thì có lẽ chúng đã chỉ dừng ở mức gpt2 hay 3
  • Điều thú vị mà Anthropic đã làm là đặt stack của họ lên trên nhiều nhà cung cấp cloud. Họ đã đưa nó lên AWS trước, ở mức độ mà đến nay khó thấy ở các nhà cung cấp AI lớn khác, nên tôi tò mò liệu tiếp theo họ có đưa lên cả GCP và Azure không
    Nếu một công ty có thể có Claude stack riêng của mình trên cloud của chính họ kiểu như ELK stack, thì nếu làm được cả với Azure và GCP, OpenAI thật sự sẽ phải gấp rút bắt kịp
    Cá nhân tôi muốn dùng AI chạy trên hạ tầng mà tôi trả tiền nhiều hơn. Nếu có sự cố thì nó vẫn được cô lập, và tôi cũng có thể thay thế bằng region hoặc data center khác
    Việc Microsoft hay Amazon không đưa hẳn mô hình của riêng họ ra tuyến đầu trong các sản phẩm cloud vẫn làm tôi ngạc nhiên. Tôi cứ nghĩ Microsoft hẳn đã đưa Phi lên rồi, nhưng lại không quảng bá nó ở vị trí nổi bật. Đặc biệt trong những thứ như Copilot for Devs, họ hoàn toàn có thể dùng các mô hình như Phi cho loại compute rẻ hơn, nhưng Microsoft thậm chí cần đổi tên lại để làm rõ Copilot rốt cuộc có nghĩa là gì

    • Hợp đồng gần đây với SpaceX AI khá gợi mở ở chỗ nó tận dụng năng lực GPU vốn bị dùng quá ít
      Việc bố trí compute là vấn đề phần cứng, nhưng để tạo ra mô hình tốt thì cần nhiều hơn compute, cần các kỹ sư AI giỏi. SpaceX, Amazon v.v. có thể rất giỏi phần cứng nhưng không hẳn mạnh tương xứng ở kỹ thuật AI
    • Claude đã dùng được trên Azure và GCP rồi
      https://azure.microsoft.com/en-us/blog/introducing-anthropic...
      https://docs.cloud.google.com/gemini-enterprise-agent-platfo...
      Claude cũng đã có trên AWS Bedrock từ lâu
      Công bố mới về “Claude Platform” là về phiên bản do Anthropic vận hành trên AWS, chứ không phải cách chạy trực tiếp trong Bedrock. Khác biệt có thể xem ở đây: https://platform.claude.com/docs/en/build-with-claude/claude...
      Nhu cầu muốn chạy trên hạ tầng trả phí của riêng mình cũng là thứ Claude đã đáp ứng từ khá lâu
      Một trong các lý do OpenAI chia tay Microsoft cũng là để có mặt trên AWS. Họ thấy nhu cầu trên AWS là đáng kể, và việc chỉ có mặt trên Azure đang trở thành lực cản
    • Claude đã có trên Vertex rồi - https://docs.cloud.google.com/vertex-ai/generative-ai/docs/p...