27 điểm bởi xguru 2025-06-02 | 1 bình luận | Chia sẻ qua WhatsApp
  • Báo cáo xu hướng của Mary Meeker xuất hiện trở lại sau 5 năm. Lần này, AI là trọng tâm. Tổng cộng 340 trang
  • Tốc độ sử dụng và phổ biến của AI nhanh hơn Internet rất nhiều, và thời điểm máy móc vượt qua con người đang đến gần
  • Động lực phía sau gồm hạ tầng Internet toàn cầu (5,5 tỷ người dùng), các bộ dữ liệu số được tích lũy hơn 30 năm, cùng sự xuất hiện của các mô hình ngôn ngữ lớn (LLM) do ChatGPT dẫn đầu và những đổi mới về tính dễ dùng/tốc độ
  • Các công ty AI mới nổi đang hành động rất quyết liệt trong đổi mới, đầu tư, ra mắt sản phẩm và huy động vốn, trong khi các tập đoàn Big Tech hiện hữu cũng đang tăng tốc đầu tư và tăng trưởng lấy AI làm trung tâm
  • Cạnh tranh AI giữa Trung Quốc và Mỹ cùng cuộc tranh giành bá quyền công nghệ toàn cầu đang diễn ra gay gắt, và báo cáo này kỳ vọng sẽ đóng góp cho thảo luận về các thay đổi công nghệ, tài chính, xã hội, vật lý và địa chính trị

Dàn ý tài liệu

  1. Liệu thay đổi đang diễn ra nhanh hơn trước đây?
    → Có, và trên thực tế đang ngày càng nhanh hơn
  2. Tăng trưởng người dùng AI + mức sử dụng + chi tiêu vốn (CapEx) =
    → Đà tăng chưa từng có (Unprecedented)
  3. Chi phí compute của mô hình AI tăng lên, còn chi phí suy luận (Inference) giảm xuống =
    → Hiệu năng đang hội tụ (Performance Converging), mức sử dụng của nhà phát triển (Developer Usage) tăng
  4. Tăng trưởng mức sử dụng (Usage) + chi phí (Cost) + thua lỗ (Loss) của AI =
    → Mức độ chưa từng có (Unprecedented)
  5. Các mối đe dọa đối với việc kiếm tiền (Monetization) từ AI =
    → Cạnh tranh gia tăng, động lực open source mở rộng, Trung Quốc trỗi dậy
  6. Sự hội tụ giữa thế giới vật lý và AI (Ramps) =
    → Nhanh và dựa trên dữ liệu (Fast + Data-Driven)
  7. Tăng trưởng người dùng Internet toàn cầu được thúc đẩy bởi AI =
    → Mức tăng trưởng chưa từng trải nghiệm trước đây
  8. Sự tiến hóa (Evolution) của AI và công việc (Work) =
    → Đang diễn ra nhanh chóng trong thực tế (Real + Rapid)

Tổng quan

  • Nói rằng “thế giới đang thay đổi với tốc độ chưa từng có” thậm chí còn là cách diễn đạt chưa đủ, vì tốc độ và phạm vi của thay đổi đang mở rộng đột ngột
  • Đổi mới công nghệ, mức độ chấp nhận (adoption) nhanh, cùng sự thay đổi trong vị thế lãnh đạo toàn cầu (leadership) là nền tảng (Underpinnings) của toàn bộ biến chuyển này
  • Sứ mệnh khi thành lập của Google (1998): 'Tổ chức thông tin của thế giới và giúp mọi người đều có thể truy cập, sử dụng'
  • Sứ mệnh khi thành lập của Alibaba (1999): 'Giúp việc kinh doanh trở nên dễ dàng ở bất cứ đâu'
  • Sứ mệnh khi thành lập của Facebook (2004): 'Giúp mọi người chia sẻ nhiều hơn, để thế giới trở nên cởi mở và kết nối hơn'
  • Ngày nay, sự kết hợp giữa AI (Artificial Intelligence), năng lực tính toán tăng tốc (Computing Power)dòng vốn không biên giới (Borderless Capital) đang thúc đẩy những thay đổi khổng lồ bằng cách cải thiện vượt bậc việc tổ chức, kết nối và khả năng tiếp cận thông tin
  • Cũng như trong thể thao, thành tích của vận động viên liên tục được cải thiện nhờ dữ liệu/đầu vào/huấn luyện, các doanh nghiệp cũng đang trở nên ngày càng thông minh và cạnh tranh hơn khi máy tính học từ những bộ dữ liệu khổng lồ
  • Đổi mới ở mô hình lớn (Large Models), giảm chi phí mỗi token (cost-per-token), sự lan rộng của open source (Open-Source Proliferation), cải thiện hiệu năng chip (Chip Performance) đang đồng thời nâng mạnh tính kinh tế, sức mạnh và khả năng tiếp cận của công nghệ
  • ChatGPT của OpenAI là ví dụ về một thành công “qua một đêm” (overnight success) nhanh nhất lịch sử xét theo các chỉ số người dùng, mức sử dụng và kiếm tiền (đạt được sau 9 năm kể từ khi thành lập)
  • Việc ứng dụng AI đang bùng nổ ở người tiêu dùng, nhà phát triển, doanh nghiệp và chính phủ
  • Trong cuộc cách mạng Internet 1.0, công nghệ khởi đầu ở Mỹ rồi lan rộng dần, nhưng ChatGPT lại được triển khai gần như đồng thời trên toàn thế giới và tăng trưởng rất nhanh
  • Các ông lớn nền tảng hiện hữu (incumbents) và những người thách thức mới (challengers) đang cạnh tranh để giành vị trí dẫn đầu trong các tầng mới của hạ tầng AI, như agentic interfaces, enterprise copilots, real-world autonomous systems và sovereign models
  • Những tiến bộ mang tính đột phá của AI, hạ tầng compute và kết nối toàn cầu (global connectivity) đang tái cấu trúc tận gốc cách thức làm việc (Work), phân bổ vốn (Capital Deployment) và cả tiêu chuẩn lãnh đạo trên phạm vi doanh nghiệp lẫn quốc gia
  • Đồng thời, sự thay đổi trong vị thế lãnh đạo toàn cầu giữa các quốc gia cũng đang diễn ra, và các cường quốc chủ chốt đang tích cực kiềm chế năng lực cạnh tranh và lợi thế so sánh của nhau
  • Các nước trên thế giới đang tăng tốc trở lại theo những tham vọng kinh tế, xã hội và lãnh thổ (Economic / Societal / Territorial Aspiration)
  • Giờ đây, hai lực lượng khổng lồ là công nghệ (Technological)địa chính trị (Geopolitical) đang ngày càng đan xen sâu sắc hơn
  • CTO của Meta Platforms, Andrew Bosworth, gần đây nói trên podcast ‘Possible’ rằng: “AI lúc này giống như một cuộc chạy đua không gian (Space Race), đặc biệt là các quốc gia lớn như Trung Quốc có năng lực rất cao, gần như không còn bí mật, và tất cả đều đang liên tục tiến bộ”
  • Năng lực lãnh đạo AI (AI Leadership) có thể trực tiếp dẫn tới vị thế lãnh đạo địa chính trị (Geopolitical Leadership) (chiều ngược lại thì không đúng)
  • Hiện tượng này đi kèm bất định lớn (Uncertainty), nhưng như cựu Chủ tịch T. Rowe Price Brian Rogers từng nói, “xét về mặt thống kê, thế giới không thường xuyên kết thúc đến vậy”, nên góc nhìn lạc quan vẫn rất quan trọng
  • Ở góc nhìn nhà đầu tư, người ta luôn giả định mọi thứ có thể đi sai, nhưng chính kỳ vọng về những gì có thể diễn ra đúng mới là nguồn gốc của hy vọng (Optimism) thực sự
  • Hình ảnh AI làm việc thay con người gợi nhớ đến sự kỳ diệu ở buổi đầu của email và tìm kiếm web, nhưng hiệu ứng tốt hơn / nhanh hơn / rẻ hơn (Better / Faster / Cheaper) đang lan rộng nhanh hơn nhiều
  • Tất nhiên, rủi ro (Danger) và bất định cũng rất lớn, nhưng về dài hạn vẫn có kỳ vọng rằng cạnh tranh mạnh mẽ (Competition), đổi mới (Innovation), năng lực compute rẻ và dễ tiếp cận (Accessible Compute), công nghệ AI lan rộng nhanh, cùng năng lực lãnh đạo thận trọng và tính toán kỹ lưỡng (Thoughtful and Calculated Leadership) sẽ tạo ra thế cân bằng kiểu răn đe hủy diệt lẫn nhau (Mutually Assured Deterrence)
  • Với một số người, sự tiến hóa của AI có thể là một cuộc đua xuống đáy (Race to the Bottom), nhưng với những người khác, đó là khởi đầu của một cuộc đua lên đỉnh (Race to the Top)
  • Sức mạnh mang tính đầu cơ và năng động của chủ nghĩa tư bản (Capitalism)sự hủy diệt sáng tạo (Creative Destruction) đang gây ra những dịch chuyển địa chấn khổng lồ
  • Đặc biệt, cuộc cạnh tranh khốc liệt giữa Mỹ (USA), Trung Quốc (China) và các lãnh đạo công nghệ toàn cầu đã bước vào trạng thái 'Game On'
  • Báo cáo này dựa trên nhiều dữ liệu, nghiên cứu và benchmark từ bên thứ ba để cho thấy một cách đa chiều các xu hướng của thời kỳ năng động (Dynamic Time) hiện nay
  • Mục tiêu cuối cùng của báo cáo là đóng góp cho cuộc thảo luận này

1. Liệu thay đổi đang diễn ra nhanh hơn trước đây?

Technology Compounding = Những con số phía sau đà tăng trưởng

"Tăng trưởng kép của công nghệ = những con số và dữ liệu ẩn sau động lực tăng trưởng bùng nổ"

  • Lịch sử của các chu kỳ điện toán và sự xuất hiện của kỷ nguyên AI
    • Thập niên 1960: mainframe (Mainframe, ~1 triệu máy) → minicomputer (Minicomputer, ~10 triệu máy) → PC (~300 triệu máy) → internet trên máy tính để bàn (Desktop Internet, ~1 tỷ người dùng) → internet di động (Mobile Internet, ~4 tỷ người dùng) → kỷ nguyên AI (AI Era, hàng tỷ đến hàng chục tỷ đơn vị)
    • Cơ sở hạ tầng điện toán được tích lũy (CPU, GPU, cloud/big data) trở thành nền tảng cho sự lan rộng của AI
    • Trong kỷ nguyên thiết bị AI, số lượng thiết bị được dự báo sẽ cao hơn từ hàng chục nghìn đến hàng trăm nghìn lần so với thời mainframe trước đây
  • Tăng trưởng của bộ dữ liệu huấn luyện mô hình AI (số từ)
    • Từ 1950 đến 2025, quy mô bộ dữ liệu huấn luyện (tính theo số từ) của các mô hình AI chủ chốt tăng trưởng trung bình 260% mỗi năm
    • Từ sau năm 2018, các mô hình lớn như GPT-2, GPT-3, GNMT xuất hiện, khiến lượng dữ liệu sử dụng tăng theo cấp số nhân
    • Gần đây, các mô hình mới như Aramco Metabrain AI được huấn luyện bằng hàng chục nghìn tỷ từ
  • Tăng trưởng compute sử dụng để huấn luyện mô hình AI (lượng phép tính, FLOP)
    • Từ 1950 đến 2025, lượng tính toán huấn luyện của các mô hình AI chủ chốt tăng trưởng trung bình 360% mỗi năm
    • Cùng với sự xuất hiện của các mô hình lớn như GPT-4, Grok, AlphaGo, Swift, chỉ số FLOP tăng vọt mạnh mẽ
  • Cải thiện hiệu quả compute nhờ đổi mới thuật toán
    • Từ 2014 đến 2023, Effective Compute của các mô hình AI tăng trung bình 200% mỗi năm
    • Các tối ưu thuật toán như Chinchilla, OPT-175B đóng góp lớn vào việc nâng cao hiệu năng và cắt giảm compute
  • Tăng trưởng hiệu năng của siêu máy tính AI
    • Từ 2019 đến 2025, hiệu năng của các siêu máy tính AI (cluster) tăng trưởng trung bình 150% mỗi năm
    • Sunway OceanLight, cluster GPT-3/4, Frontier, El Capitan, xAI Colossus, v.v.
    • Hiệu năng chip và số chip trong mỗi cluster cùng tăng trưởng đồng thời
  • Sự bùng nổ về số lượng mô hình AI quy mô lớn, mạnh mẽ
    • Từ 2017 đến 2024, tăng 167% mỗi năm: số mô hình AI quy mô lớn với trên 10^23 FLOP được phát hành tăng vọt
    • Nhiều bên chơi đa dạng lần lượt xuất hiện như DeepMind (AlphaGo), xAI, Anthropic, Meta, NVIDIA, Mistral
  • Tăng trưởng người dùng, thuê bao và doanh thu của ChatGPT
    • Tính từ 10.2022 đến 4.2025, người dùng hoạt động hàng tuần (Users, MM), thuê bao (Subscriber, MM), doanh thu (Revenue, $B) đều tăng trưởng theo cấp số nhân
    • Hơn 800 triệu người dùng hàng tuần, hơn 20 triệu thuê bao, doanh thu năm tiến sát 4 tỷ USD
  • Tốc độ đạt 365 tỷ lượt tìm kiếm mỗi năm: ChatGPT so với Google
    • ChatGPT: đạt 365 tỷ lượt tìm kiếm/năm chỉ trong 2 năm (2024)
    • Google: mất 11 năm để đạt cùng con số (2009)
    • ChatGPT ghi nhận tốc độ lan rộng nhanh hơn Google 5,5 lần
  • Năm 1998, khi internet bắt đầu phổ cập, Google khởi đầu với mục tiêu "sắp xếp thông tin của thế giới và làm cho nó có thể truy cập và hữu ích với mọi người"
  • Sau gần 30 năm, trong tốc độ thay đổi nhanh nhất mà nhân loại từng trải qua, hiện nay phần lớn thông tin đã ở trạng thái được số hóa, có thể truy cập, có thể khai thác
  • Sự thay đổi trong cách tiếp cận và dịch chuyển thông tin dựa trên AI đang diễn ra còn nhanh hơn nhiều
  • AI là Compounder (thực thể tăng trưởng theo hiệu ứng kép) trên nền hạ tầng internet,
    tạo ra hiện tượng các dịch vụ mà ai cũng có thể dễ dàng sử dụng và thu hút sự chú ý đại chúng lan rộng với tốc độ cực kỳ nhanh

Sự tiến hóa của phân phối tri thức (Knowledge Distribution Evolution)

  • 1440~1992: Static + Physical Delivery
    • Từ phát minh máy in (Printing Press) năm 1440 đến 1992, tri thức được phân phối theo cách tĩnh (Static) và vật lý (Physical)
    • Tức là cấu trúc truyền đạt tri thức xoay quanh ấn phẩm in như sách giấy, báo, tạp chí đã được duy trì suốt hàng trăm năm
  • 1993~2021: Active + Digital Delivery
    • Sau khi internet (World Wide Web) được công bố năm 1993, đã chuyển sang hình thức truyền đạt tri thức chủ động (Active) và dựa trên kỹ thuật số (Digital)
    • Bất kỳ ai cũng có thể tạo website, đồng thời truy cập và phân phối thông tin theo thời gian thực
    • Internet đã tạo ra một cuộc biến đổi căn bản trong việc “công khai và lưu thông tri thức”
  • 2022+: Active + Digital + Generative Delivery
    • Cùng với sự ra mắt của ChatGPT vào năm 2022, nhân loại bước vào thời đại truyền đạt tri thức dựa trên AI tạo sinh
      • Generative AI: AI có thể tạo ra nhiều loại nội dung như văn bản, hình ảnh, âm thanh, mã nguồn
      • ChatGPT lập kỷ lục tăng trưởng chưa từng có khi vượt mốc 1 triệu người dùng chỉ sau 5 ngày ra mắt
    • Giờ đây, tri thức không còn chỉ được lưu trữ và tìm kiếm, mà là thời đại AI sáng tạo ra và truyền đạt ngay lập tức

“Kiến thức là sự tích lũy của sự kiện (wisdom), còn trí tuệ nằm ở sự đơn giản hóa chúng” – Martin H. Fischer

  • AI = Many Years Before Lift-Off
    • Công nghệ AI trông như đã tăng trưởng bùng nổ trong thời gian ngắn, nhưng trước khi thật sự đại chúng hóa đã có hàng chục năm chuẩn bị và phát triển
  • Dòng thời gian cột mốc AI 1950~2025 (do Stanford tổng hợp)
    • 1950.10: Alan Turing công bố bài kiểm tra Turing (đề xuất khái niệm đánh giá trí thông minh của máy tính)
    • 1956.6: Tổ chức Dartmouth Conference, John McCarthy đặt ra thuật ngữ ‘Artificial Intelligence’
    • 1962.1: Arthur Samuel của IBM dùng chương trình tự học trong trò chơi checkers để đánh bại nhà vô địch Mỹ
    • 1966.1: Shakey của Stanford, robot di động đa dụng đầu tiên được triển khai
    • 1967~1996: “Mùa đông AI” (AI Winter) – đầu tư và quan tâm suy giảm do thiếu tiến bộ lớn
    • 1997.5: IBM Deep Blue đánh bại nhà vô địch cờ vua thế giới Kasparov
    • 2002.9: Roomba ra mắt robot hút bụi sản xuất hàng loạt đầu tiên
    • 2005.10: Xe tự hành Stanley của Stanford hoàn thành DARPA Grand Challenge
    • 2010.4: Apple mua lại Siri và tích hợp vào iPhone 4S
    • 2014.6: Chatbot Eugene Goostman vượt qua bài kiểm tra Turing
    • 2018.6: OpenAI công bố GPT-1, mô hình ngôn ngữ lớn đầu tiên
    • 2020.6: OpenAI ra mắt GPT-3 và cấp giấy phép độc quyền cho Microsoft
    • 2022.11: OpenAI phát hành công khai ChatGPT
    • 2023.3: OpenAI ra mắt GPT-4 (multimodal) / Microsoft tích hợp Copilot / Google ra mắt Bard / Anthropic ra mắt Claude
    • 2023.11: 28 quốc gia gồm Mỹ, EU, Trung Quốc ký Tuyên bố AI Safety tại Bletchley
    • 2024.3~5: Meta công bố Llama 3 (open source) / Bộ An ninh Nội địa Mỹ công bố lộ trình AI / Google đưa tính năng tìm kiếm dựa trên AI vào sử dụng / OpenAI ra mắt GPT-4o (hoàn toàn multimodal)
    • 2024.7: Apple công bố Apple Intelligence (cho nhà phát triển)
    • 2024.9: Alibaba phát hành 100 mô hình open source Qwen 2.5 (hiệu năng ngang tầm phương Tây)
    • 2024.12: OpenAI công bố o3 (mô hình hiệu năng cao nhất)
    • 2025.1: DeepSeek công bố mô hình suy luận open source R1·R1-Zero / Alibaba công bố Qwen2.5-Max (vượt GPT-4o, Claude 3.5 về hiệu năng suy luận)
    • 2025.2: OpenAI ra mắt GPT-4.5 / Anthropic công bố Claude 3.7 Sonnet / xAI ra mắt Grok 3
    • 2025.4: ChatGPT đạt 800 triệu người dùng hàng tuần

Circa Q2:25 - 10 điều AI có thể làm ngày nay (theo ChatGPT)

  1. Viết hoặc chỉnh sửa mọi thứ: soạn thảo/chỉnh sửa ngay lập tức và trôi chảy email, bài luận, hợp đồng, thơ, mã nguồn, v.v.
  2. Tóm tắt và giải thích tài liệu phức tạp: dễ dàng diễn giải PDF, tài liệu pháp lý, nghiên cứu, mã nguồn và chuyển thành tiếng Anh thông dụng
  3. Đóng vai gia sư cho gần như mọi chủ đề: hỗ trợ học tập theo từng bước cho toán, lịch sử, ngôn ngữ, luyện thi, v.v.
  4. Trở thành đối tác tư duy: hỗ trợ suy nghĩ như brainstorm ý tưởng, gỡ lỗi logic, kiểm tra giả thuyết, v.v.
  5. Tự động hóa công việc lặp lại: tạo báo cáo, sắp xếp dữ liệu, tóm tắt slide, viết lại văn bản, v.v.
  6. Đóng vai theo nhu cầu: thực hiện nhiều vai trò khác nhau như chuẩn bị phỏng vấn, mô phỏng khách hàng, diễn tập hội thoại, v.v.
  7. Kết nối công cụ: viết mã tích hợp với nhiều công cụ như API, bảng tính, lịch, web code, v.v.
  8. Hỗ trợ tâm lý và làm bạn đồng hành: cùng trò chuyện về một ngày, tái cấu trúc suy nghĩ hoặc đơn giản là lắng nghe
  9. Hỗ trợ tìm mục đích sống: làm rõ giá trị, đặt mục tiêu, lập kế hoạch hành động, v.v.
  10. Tổ chức cuộc sống: lập kế hoạch du lịch, thiết kế thói quen, cấu trúc một tuần hoặc quy trình công việc, v.v.

Circa 2030? - 10 điều AI được dự đoán có thể làm trong 5 năm tới (theo ChatGPT)

  1. Tạo văn bản, mã nguồn và lập luận ở mức con người: tạo ra kết quả tương đương con người trong chatbot, kỹ thuật phần mềm, kế hoạch kinh doanh, phân tích pháp lý, v.v.
  2. Sáng tạo phim/trò chơi trọn thời gian: tự động sản xuất toàn bộ nội dung như kịch bản, nhân vật, cảnh quay, cơ chế gameplay, lồng tiếng, v.v.
  3. Hiểu và nói như con người: trợ lý nhận biết cảm xúc, tác nhân giọng nói đa ngôn ngữ thời gian thực, v.v.
  4. Đóng vai trợ lý cá nhân nâng cao: lập kế hoạch cuộc sống, gợi nhớ ký ức, đồng bộ lịch và thông tin giữa mọi ứng dụng/thiết bị, v.v.
  5. Vận hành robot hình người: giúp việc gia đình, chăm sóc người cao tuổi, tự động hóa bán lẻ và hospitality, v.v.
  6. Vận hành dịch vụ khách hàng/bán hàng tự động: giải quyết vấn đề end-to-end, upselling, tích hợp CRM, hỗ trợ 24/7, v.v.
  7. Cá nhân hóa toàn bộ đời sống số của từng người: học tập thích ứng, gợi ý nội dung động, chăm sóc sức khỏe cá nhân hóa, v.v.
  8. Xây dựng và vận hành doanh nghiệp tự chủ: startup dựa trên AI, tối ưu tồn kho/giá, vận hành số toàn diện, v.v.
  9. Tự động hóa khám phá khoa học: thiết kế thuốc mới, tổng hợp vật liệu mới, mô hình hóa khí hậu, kiểm thử giả thuyết mới, v.v.
  10. Hợp tác sáng tạo như một đối tác: đồng sáng tác tiểu thuyết, sản xuất âm nhạc, thiết kế thời trang, kiến trúc và nhiều hoạt động sáng tạo khác

Circa 2035? - 10 điều AI được dự đoán có thể làm trong 10 năm tới (theo ChatGPT)

  1. Thực hiện nghiên cứu khoa học: tạo giả thuyết, chạy mô phỏng, thiết kế và phân tích thí nghiệm, v.v.
  2. Thiết kế công nghệ tiên tiến: khám phá vật liệu mới, thiết kế biotech, tạo nguyên mẫu hệ thống năng lượng, v.v.
  3. Mô phỏng tâm trí giống con người: tạo persona số có ký ức, cảm xúc và hành vi thích nghi
  4. Vận hành doanh nghiệp tự chủ: quản lý R&D, tài chính, logistics với mức can thiệp của con người tối thiểu
  5. Thực hiện các tác vụ vật lý phức tạp: thao tác công cụ, lắp ráp linh kiện, thích ứng trong môi trường thực tế, v.v.
  6. Điều phối hệ thống toàn cầu: tối ưu hóa logistics, sử dụng năng lượng, ứng phó khủng hoảng trên quy mô lớn
  7. Mô hình hóa hệ thống sinh học: mô phỏng tế bào, gene, sinh vật và ứng dụng cho điều trị/nghiên cứu
  8. Đưa ra quyết định ở cấp độ chuyên gia: cung cấp tư vấn pháp lý, y tế, kinh doanh theo thời gian thực
  9. Tham gia tranh luận công khai và hình thành chính sách: điều phối diễn đàn, đề xuất dự luật, điều chỉnh lợi ích các bên, v.v.
  10. Xây dựng thế giới ảo nhập vai: tạo môi trường 3D tương tác chỉ bằng text prompt

Tốc độ phát triển AI đã vượt xa dự đoán

  • Sự thay đổi trong chủ thể phát triển mô hình machine learning (2003~2024)
    • Từ 2003 đến 2014, giới học thuật (academia) dẫn dắt việc phát triển mô hình machine learning (Academia Era)
    • Từ sau 2015, giới công nghiệp (industry) vượt xa giới học thuật về dữ liệu, compute và lượng vốn投入, dẫn dắt đổi mới (Industry Era)
    • Tính đến 2024, giới công nghiệp mỗi năm phát triển khoảng hơn 60 mô hình ML đáng chú ý
  • Số lượng nhà phát triển AI tăng vọt (theo hệ sinh thái NVIDIA, 2005~2025)
    • Số nhà phát triển toàn cầu trong hệ sinh thái NVIDIA tăng gấp 6 lần chỉ trong 7 năm (dự kiến đạt 6 triệu người vào năm 2025)
    • Tăng mạnh nhất trong giai đoạn 2018~2025
  • Số lượng nhà phát triển trong hệ sinh thái AI của Google (2024~2025)
    • Tháng 5/2024: 1,4 triệu người → tháng 5/2025: 7 triệu người
    • Tăng gấp 5 lần chỉ trong 1 năm, cộng đồng nhà phát triển AI bùng nổ xoay quanh nền tảng Gemini
  • Bùng nổ số lượng bằng sáng chế Mỹ liên quan đến điện toán (1960~2024)
    • Trong 8 năm sau IPO của Netscape năm 2003: +6.300 bằng, trong 18 năm 2004~2022: tăng thêm +1.000 bằng
    • Chỉ 1 năm sau khi ChatGPT ra mắt (2022), tăng vọt +6.000 bằng
    • Các bằng sáng chế đổi mới liên quan đến công nghệ điện toán/AI đang được tung ra trên quy mô lớn
  • Hiệu năng AI vượt mức con người vào năm 2024
    • Trong benchmark MMLU (kiến thức tổng quát + suy luận), tính đến 2024 các hệ thống AI đạt độ chính xác 92,3%, vượt con người (89,8%)
  • Khả năng phân biệt con người của AI (Q1 2025)
    • GPT-4o (không gồm persona): 73% câu trả lời bị nhầm là do con người trả lời
    • GPT-4.5 (gồm persona): hơn 90% thất bại trong việc nhận ra đó là AI
    • Tính giống người/cảm giác chân thực trong phản hồi của AI đã cải thiện vượt bậc
  • Độ chân thực của hội thoại AI (trường hợp Turing test)
    • Ví dụ hội thoại Turing test thực tế sử dụng GPT-4.5
    • 87% người tham gia thí nghiệm nhầm bên (A) là con người dù thực tế đó là AI,
      trong khi con người (B) lại bị đánh giá là “mang cảm giác giống AI”
    • Khả năng hội thoại tự nhiên của AI hiện đại đã vượt con người
  • Tiến hóa về hiệu năng tạo ảnh AI
    • So sánh Midjourney v1 (2022) và v7 (2025):
      chỉ trong 3 năm, kết quả tạo trang sức (dây chuyền hoa hướng dương) đã trở nên chân thực áp đảo
  • Ảnh do AI tạo vs ảnh thật (2024)
    • Tính đến 2024, ảnh chân dung do AI tạo (StyleGAN2) đã tinh xảo đến mức gần như không thể phân biệt với ảnh thật
    • Độ chân thực của ảnh sinh ra đã tăng mạnh
  • Tính chân thực của tạo/biên dịch giọng nói bằng AI (trường hợp ElevenLabs)
    • Công cụ tạo giọng nói AI của ElevenLabs
      • đã được nâng cấp mạnh với tự động lồng tiếng, dịch đa ngôn ngữ theo thời gian thực, giữ nguyên giọng gốc, v.v.
      • lưu lượng truy cập toàn cầu vượt 20 triệu lượt/tháng chỉ trong 2 năm, 60% doanh nghiệp Fortune 500 đã áp dụng
    • Tạo và dịch âm thanh bằng AI cũng đang phát triển bùng nổ
  • Phổ cập dịch âm thanh dựa trên AI (Spotify, tháng 5/2025)
    • Spotify hợp tác với ElevenLabs, bắt đầu chấp nhận dịch AI cho audiobook sang 29 ngôn ngữ
    • Đưa ra tầm nhìn về “thời đại ai cũng có thể tạo nội dung bằng tiếng mẹ đẻ, và AI dịch theo thời gian thực để truyền tải ra toàn thế giới” (CEO Daniel Ek)
    • Tính đến quý 1 năm 2025, có 678 triệu người dùng hoạt động hàng tháng, 268 triệu thuê bao, doanh thu năm 16,8 tỷ euro
  • Tăng tốc hiệu năng AI: các ca ứng dụng mới (tháng 11/2024, Morgan Stanley)
    • Protein Folding: DeepMind AlphaFold, dự đoán gần như mọi cấu trúc protein
    • Cancer Detection: Microsoft & Paige, xây dựng mô hình chẩn đoán ung thư dựa trên hình ảnh lớn nhất thế giới
    • Robotics: Google, demo robot dùng LLM để hiểu và thực hiện chỉ dẫn của con người
    • Agentic AI: Amazon, công bố công cụ thực hiện tác vụ theo chỉ dẫn người dùng
    • Universal Translation: Meta, công bố mô hình AI đa phương thức phiên dịch/biên dịch đa ngôn ngữ
    • Digital Video Creation: Channel 1 AI, trình diễn sản xuất video tin tức cá nhân hóa dựa trên GenAI

Lợi ích và rủi ro của AI (Benefits & Risks)

  • Lợi ích của phát triển AI
    • Mọi thành tựu của nền văn minh nhân loại đều là sản phẩm của trí tuệ con người, và khi mức độ của machine intelligence tăng lên, tham vọng của nhân loại cũng được mở rộng đáng kể
    • AI và robot có thể giải phóng loài người khỏi lao động lặp đi lặp lại, mở ra kỷ nguyên hòa bình và thịnh vượng nhờ gia tăng năng suất
    • Có thể đẩy nhanh việc giải quyết các vấn đề về bệnh tật, biến đổi khí hậu và tài nguyên thông qua tăng tốc nghiên cứu khoa học
    Quảng cáo
  • Rủi ro của phát triển AI
    • Demis Hassabis (Google DeepMind): "Chúng ta phải giải quyết AI trước thì mới có thể giải quyết mọi thứ khác. Tuy nhiên, trước khi có được cơ hội đó, các rủi ro từ việc lạm dụng, sử dụng sai mục đích và rủi ro ngoài chủ đích của AI có thể xảy ra"
    • Những rủi ro đã bộc lộ và sẽ còn gia tăng trong tương lai: vũ khí tự động sát thương (lethal autonomous weapons), giám sát (surveillance), ra quyết định thiên lệch (biased decision making), tác động tới việc làm (employment impact), an toàn và bảo mật (safety-critical applications, cybersecurity), v.v.

"Sự thành công trong phát triển AI có thể là sự kiện lớn nhất trong lịch sử văn minh nhân loại, nhưng đồng thời cũng có thể là sự kiện cuối cùng nếu chúng ta không học được cách tránh các rủi ro của nó" - Stephen Hawking

AI User + Usage + CapEx Growth = Chưa từng có tiền lệ

  • Tính riêng ChatGPT, chỉ trong 17 tháng đã vượt mốc 800 triệu người dùng hoạt động hàng tuần (+8 lần)
  • Tốc độ phổ cập toàn cầu của AI (Global Adoption) cũng lan rộng chưa từng có tiền lệ so với giai đoạn đầu của Internet (đạt 90% người dùng ngoài Bắc Mỹ chỉ sau 3 năm, trong khi Internet mất 23 năm)
  • ChatGPT chỉ mất 0,2 năm (khoảng 2 tháng) để đạt 100 triệu người dùng, tăng trưởng vượt trội so với các dịch vụ Internet lớn như TikTok, Instagram, YouTube
  • Để đạt 1 triệu người dùng (khách hàng), Ford Model T cần 2.500 ngày, iPhone cần 74 ngày, còn ChatGPT: 5 ngày — chi phí tiếp cận cũng là $0, đưa khả năng tiếp cận lên mức cao nhất
  • Dự kiến chỉ mất 3 năm để 50% hộ gia đình tại Mỹ sử dụng AI, so với Internet di động (6 năm), desktop (12 năm), PC (20 năm), Cách mạng Công nghiệp (42 năm) — rút ngắn một nửa
  • Tốc độ triển khai và lan rộng của AI nhanh hơn bất kỳ công nghệ nào trong lịch sử, và phạm vi cũng như quy mô ảnh hưởng của nó cũng vượt xa dự đoán

Doanh nghiệp công nghệ đưa AI thành ưu tiên số một

  • Big Tech và các công ty công nghệ lớn đang tập trung AI như chủ đề quản trị cốt lõi
    • NVIDIA, Google, Microsoft, Meta, Amazon, Baidu, IBM, C3.ai, v.v.
    • Trong các báo cáo kết quả kinh doanh giai đoạn 2020~2024, tần suất nhắc đến AI tăng vọt, cho thấy cạnh tranh lấy AI làm trung tâm đã thực sự bắt đầu
  • Amazon (CEO Andy Jassy)
    • "Generative AI sẽ đổi mới gần như mọi trải nghiệm khách hàng"
    • Ứng dụng và tối ưu AI trong mọi lĩnh vực như lập trình, tìm kiếm, mua sắm, tài chính, y tế, robot, công nghệ sinh học
  • Google (CEO Sundar Pichai)
    • "AI là phương tiện quan trọng nhất để thúc đẩy sứ mệnh của chúng tôi (tổ chức thông tin và cung cấp khả năng tiếp cận phổ quát)"
    • "Cơ hội từ AI khác biệt về đẳng cấp so với mọi thứ trước đây"
  • Duolingo (CEO Luis von Ahn)
    • "Generative AI đóng góp vào việc tạo dữ liệu, phát triển tính năng mới và nâng cao hiệu quả trên toàn công ty"
    • Ngay cả chương trình học cờ vua cũng đã được hoàn thiện nguyên mẫu chỉ bằng AI
  • xAI (CEO Elon Musk)
    • "Bản chất của Grok AI là truy cầu sự thật (truth-seeking), điều cốt yếu đối với an toàn AI"
    • "Chúng ta phải tạo ra AI hướng tới sự thật ở mức tối đa có thể"
  • Roblox (CEO David Baszucki)
    • "AI là công cụ gia tốc giúp tối đa hóa năng lực cá nhân; trong tương lai, mỗi người sẽ đồng hành cùng AI của riêng mình"
  • NVIDIA (CEO Jensen Huang)
    • "Trong vòng 10 năm tới, AI sẽ trở thành hạ tầng của mọi ngành, mọi quốc gia và mọi công ty"
    • "Data center AI về bản chất là 'AI factory', tạo ra giá trị khổng lồ"
  • Các lãnh đạo công nghệ toàn cầu đang đặt cược sống còn vào việc triển khai AI và mở rộng hạ tầng, đồng loạt nhấn mạnh rằng AI là cốt lõi năng lực cạnh tranh của doanh nghiệp và xã hội tương lai

Doanh nghiệp truyền thống cũng nhanh chóng nâng AI thành ưu tiên

  • Mức độ quan tâm tới AI của các công ty S&P 500 tăng mạnh
    • Tính đến quý 4/2024, 50% doanh nghiệp trong S&P 500 nhắc đến 'AI' trong các cuộc họp công bố kết quả kinh doanh (tăng mạnh so với năm 2015)
    • AI đang nổi lên như một agenda chiến lược cốt lõi trên toàn bộ khối doanh nghiệp
  • Mục tiêu triển khai AI của các tập đoàn toàn cầu là 'tăng trưởng doanh thu'
    • Trong 2 năm tới, phần lớn mục tiêu đầu tư vào Generative AI (GenAI) tập trung vào tăng trưởng và lợi nhuận như năng suất, dịch vụ khách hàng, doanh thu và hiệu quả marketing
    • Cắt giảm chi phí (cost reduction) là ưu tiên tương đối thấp hơn
  • 75% CMO toàn cầu (giám đốc marketing) đang thử nghiệm/triển khai công cụ AI
    • Phần lớn tổ chức marketing đang tiến hành thử nghiệm ban đầu hoặc pilot, và không ít nơi đã triển khai AI toàn diện
  • Các ví dụ triển khai thực tế
    • Bank of America: Erica Virtual Assistant
      • 40 triệu khách hàng, 2,5 tỷ lượt tương tác tích lũy, hơn 50.000 lần cập nhật hiệu năng
      • Đã trở thành trợ lý tài chính số hoạt động 24/7
    • JP Morgan: hiện đại hóa AI end-to-end
      • Nhờ triển khai AI/ML, kỳ vọng doanh thu và hiệu quả giai đoạn 2023~2025 đều tăng +35~65%
    • Kaiser Permanente: hồ sơ y tế ứng dụng AI (AI Scribe)
      • Hàng nghìn nhân viên y tế đã áp dụng, giảm gánh nặng tài liệu hóa, cải thiện trải nghiệm bệnh nhân và chất lượng khám chữa bệnh
    • Yum! Brands: Byte by Yum!
      • Tính đến năm 2025, đã triển khai hệ thống đặt hàng và vận hành dựa trên AI tại 25.000 nhà hàng
  • Ngay cả các tập đoàn truyền thống cũng đang xem AI không phải là công cụ 'cắt giảm chi phí' mà là ưu tiên chiến lược xoay quanh tăng trưởng và đổi mới
    • Các trường hợp thành công cụ thể trong ứng dụng AI đang nhanh chóng được tích lũy ở từng ngành

AI trong giáo dục, chính phủ và nghiên cứu cũng nhanh chóng trở thành ưu tiên

  • Các trường hợp tích hợp AI trong lĩnh vực giáo dục (cơ sở giáo dục)
    • Arizona State University: thành lập tổ chức chuyên trách phát triển công cụ AI ('AI Acceleration')
    • Oxford-OpenAI partnership: hợp tác 5 năm để tăng cường nghiên cứu và năng lực hiểu biết về AI
    • NextGenAI: ra mắt liên minh quy mô 50 triệu USD với sự tham gia của 15 đại học nghiên cứu như MIT, Harvard, Caltech
    • ChatGPT Gov: ra mắt ChatGPT dành riêng cho các cơ quan chính phủ liên bang Mỹ (tháng 1/2025)
    • Các phòng thí nghiệm quốc gia của Mỹ: hợp tác hạ tầng AI trong các lĩnh vực năng lượng hạt nhân, an ninh mạng và khoa học tiên tiến
  • Mở rộng chính sách triển khai của chính phủ (Sovereign AI)
    • NVIDIA Sovereign AI Partners: bắt đầu tăng tốc xây dựng hạ tầng AI cấp quốc gia tại Pháp, Thụy Sĩ, Tây Ban Nha, Ecuador, Nhật Bản, Việt Nam, Singapore, v.v.
    • "Việc các quốc gia đầu tư vào hạ tầng AI tương tự như trước đây đầu tư vào điện lực và hạ tầng Internet" (CEO NVIDIA Jensen Huang)
  • Mở rộng ứng dụng AI trong nghiên cứu (R&D) và y tế
    • Thiết bị y tế AI được FDA phê duyệt: tính riêng năm 2023 có 223 trường hợp được phê duyệt mỗi năm, tăng bùng nổ so với năm 2015 (ngân sách AI của chính phủ liên bang Mỹ FY21~FY25 là 14,7 tỷ USD)
    • Phát triển thuốc dựa trên AI: rút ngắn 30~80% thời gian để đạt tới giai đoạn tiền lâm sàng (Pre-Clinical) so với phương pháp truyền thống (tăng tốc 1,5~12 lần)
  • Ngay cả trong các lĩnh vực phi lợi nhuận/công như giáo dục, chính phủ, nghiên cứu và y tế, việc triển khai và tích hợp AI cũng đang lan rộng nhanh chóng
    • Nhờ đầu tư hạ tầng, nới lỏng quy định và nghiên cứu chung, tốc độ đổi mới AI ngoài lĩnh vực công nghiệp cũng đang được đẩy nhanh

AI User + Usage + CapEx Growth = Chưa từng có tiền lệ

  • Tình hình tỷ lệ sử dụng ChatGPT của người trưởng thành tại Mỹ
    • Tỷ lệ người trưởng thành tại Mỹ từng sử dụng ChatGPT đã tăng vọt từ 18% vào tháng 7/2023 lên 37% vào tháng 1/2025
    • Nhóm 18~29 tuổi đạt 55%, nhóm 30~49 tuổi đạt 44%, cho thấy người càng trẻ càng sử dụng nhiều hơn
    • CEO OpenAI Sam Altman nhận định rằng “người trẻ dùng như cố vấn cuộc sống, còn người lớn tuổi dùng như công cụ thay thế tìm kiếm”
  • Thời gian sử dụng trung bình hằng ngày của ứng dụng ChatGPT tăng
    • Từ tháng 7/2023 đến tháng 4/2025, thời gian sử dụng trung bình hằng ngày tăng 202% đối với người dùng ứng dụng ChatGPT tại Mỹ
    • Tăng từ khoảng 7 phút mỗi ngày lên gần 20 phút, cho thấy mức độ gắn bó của người dùng với ứng dụng AI tăng mạnh
  • Số phiên và thời lượng mỗi phiên của ứng dụng ChatGPT tăng
    • Từ tháng 7/2023 đến tháng 4/2025, số phiên trung bình tăng 106%, thời gian mỗi phiên cũng tăng 47%
    • Người dùng sử dụng ứng dụng thường xuyên hơn và lâu hơn, cho thấy công cụ AI đang dần trở thành một phần của đời sống hằng ngày
  • So sánh tỷ lệ duy trì người dùng hằng tuần giữa ChatGPT và Google Search
    • Tính từ tháng 1/2023 đến tháng 4/2025, tỷ lệ duy trì hằng tuần của ChatGPT đạt 80%, vượt xa mức 58% của Google Search
    • Mức độ trung thành của người dùng với dịch vụ AI được ghi nhận cao hơn so với tìm kiếm truyền thống
  • Hiệu quả của việc sử dụng chatbot AI trong môi trường làm việc tại Mỹ
    • Hơn 72% người lao động Mỹ sử dụng chatbot AI cho biết họ trải nghiệm hiệu quả công việc “nhanh hơn và tốt hơn”
    • Cả hiệu suất làm việc lẫn chất lượng công việc đều được báo cáo là thay đổi theo hướng tích cực
  • Các trường hợp sử dụng ChatGPT của sinh viên đại học Mỹ
    • Mục đích sử dụng ChatGPT của sinh viên đại học Mỹ (18~24 tuổi) tập trung vào khởi đầu bài luận/dự án, tóm tắt văn bản, brainstorming ý tưởng, giải quyết vấn đề, chuẩn bị thi cử, nghiên cứu, tutoring và tư vấn định hướng nghề nghiệp
    • AI đang được sử dụng tích cực từ giải quyết bài tập thực tế, công việc sáng tạo cho đến hoạch định lộ trình nghề nghiệp
  • Dịch vụ tự động hóa deep research dựa trên AI
    • Các công ty lớn như Google Gemini, OpenAI ChatGPT, xAI Grok đang mở rộng tính năng deep research
    • Tự động hóa các công việc tri thức nâng cao như khảo sát web tự động, rút ra insight, tự động tạo báo cáo dài hàng chục trang, truy tìm fact đang được đẩy nhanh

Sự tiến hóa của AI agent = từ phản hồi chat sang tự động hóa công việc thực tế

  • Chatbot truyền thống chỉ dừng ở hội thoại hạn chế và trả lời các câu hỏi đơn giản, nhưng AI agent đang phát triển thành nhà cung cấp dịch vụ có thể tự suy luận, thực thi, xử lý tác vụ nhiều bước
    • Ví dụ: đặt lịch họp, nộp báo cáo, đăng nhập công cụ, tự động hóa workflow giữa nhiều nền tảng
    • Trực tiếp thực thi các công việc phức tạp chỉ bằng lệnh ngôn ngữ tự nhiên
  • Sự thay đổi này tương tự xu hướng chuyển từ website tĩnh sang các web app động như Gmail, Google Maps vào đầu những năm 2000
    • Tiến hóa từ giao diện nhắn tin đơn giản thành hạ tầng thực thi công việc thực tế
  • Khác với các assistant đời đầu chỉ cung cấp đầu vào rõ ràng hoặc kết quả giới hạn, AI agent nay có định hướng mục tiêu·tính tự chủ·cơ chế bảo vệ, nhờ đó có thể thực thi các quy trình phức tạp như diễn giải ý định, quản lý bộ nhớ, cộng tác giữa các ứng dụng
  • Doanh nghiệp là bên thúc đẩy triển khai nhanh nhất, vượt qua giai đoạn thử nghiệm đơn thuần để chính thức tăng đầu tư vào framework và xây dựng hệ sinh thái agent
  • Mối quan tâm toàn cầu đối với AI Agent tăng vọt (Google Search Trends, 2024~2025)
    • Lượng tìm kiếm trên Google cho từ khóa “AI Agent” đã tăng 1.088% chỉ trong 16 tháng
    • Sau khi OpenAI ra mắt công cụ phát triển AI Agent vào tháng 3/2025, lượng tìm kiếm còn tăng dốc hơn, cho thấy đây là một bước ngoặt công nghệ của ngành
  • Các ông lớn AI incumbent đẩy nhanh việc ra mắt sản phẩm AI Agent (2024~2025)
    • Các tập đoàn big tech tiêu biểu như Salesforce, Anthropic, OpenAI, Amazon liên tiếp tung ra sản phẩm mới dựa trên AI agent
      • Salesforce Agentforce: tự động hóa hỗ trợ khách hàng, tìm kiếm lead, theo dõi đơn hàng
      • Anthropic Claude 3.5 Computer Use: điều khiển trực tiếp màn hình máy tính, trích xuất dữ liệu web, mua sắm trực tuyến
      • OpenAI Operator: tự động hóa các tác vụ trực tuyến phức tạp
      • Amazon Nova Act: tự động hóa nhà ở, thu thập thông tin, mua sắm, quản lý lịch trình
    • Các sản phẩm AI Agent đang vượt ra ngoài chatbot truyền thống để mở rộng thành công cụ tự động hóa thực chất có thể thay con người làm việc

Biên giới tiếp theo của AI = Artificial General Intelligence

  • Artificial General Intelligence(AGI) là gì?
    • AGI là hệ thống có thể thực hiện toàn bộ các công việc trí tuệ của con người như suy luận, lập kế hoạch, học từ lượng dữ liệu nhỏ, khái quát hóa tri thức giữa nhiều lĩnh vực khác nhau
    • Khác với các mô hình AI hiện nay chủ yếu thể hiện năng lực vượt trội trong một số lĩnh vực nhất định, AGI có thể linh hoạt giải quyết cả những vấn đề mới mà không cần huấn luyện lại, bất kể lĩnh vực nào
    • Gần đây, quy mô mô hình, dữ liệu huấn luyện và hiệu quả tính toán tăng trưởng theo cấp số nhân đang đẩy nhanh tiến trình phát triển AGI
  • Thời điểm đạt AGI và kỳ vọng xung quanh nó
    • Thời điểm đạt được AGI vẫn chưa chắc chắn, nhưng kỳ vọng của giới chuyên gia đã được đẩy nhanh đáng kể trong vài năm gần đây
    • Vào tháng 1/2025, CEO OpenAI Sam Altman đã đề cập rằng “giờ đây chúng tôi tin chắc mình biết cách tạo ra AGI theo nghĩa truyền thống”
    • Điều này cho thấy khoảng cách giữa nghiên cứu và triển khai thực tế đang thu hẹp nhờ sự phát triển của cấu trúc mô hình, hiệu quả suy luận (inference) và môi trường huấn luyện quy mô lớn
      • Suy luận (inference) là quá trình một mô hình đã được huấn luyện hoàn chỉnh thực hiện dự đoán, trả lời hoặc tạo nội dung dựa trên đầu vào của người dùng. Giai đoạn này nhanh và hiệu quả hơn rất nhiều so với huấn luyện
    • AGI đang bắt đầu được nhìn nhận không còn là đích đến giả định, mà là một ngưỡng có thể đạt tới
  • Ý nghĩa của việc đạt AGI
    • Nếu AGI trở thành hiện thực, vai trò bản chất của phần mềm và phần cứng sẽ được định nghĩa lại
    • Thay vì lặp lại các tác vụ được lập trình sẵn, hệ thống sẽ chuyển thành loại có thể hiểu mục tiêu, lập kế hoạch và tự hiệu chỉnh theo thời gian thực
    • Nhiều workflow trong nghiên cứu, kỹ thuật, giáo dục, logistics... có thể được vận hành ngay cả khi không có giám sát của con người
    • Ngay cả khi đối mặt với vấn đề mới, hệ thống vẫn có thể thích nghi theo ngữ cảnh mà không cần huấn luyện lại, hoạt động như chuyên gia con người
    • Robot hình người dựa trên AGI có thể thay đổi tận gốc môi trường vật lý và cách con người làm việc
  • Tác động xã hội mà AGI mang lại
    • AGI không phải là điểm đích cuối cùng, mà là sự chuyển đổi theo từng giai đoạn của năng lực
    • Thể chế, lao động và cấu trúc ra quyết định sẽ được tái cấu trúc tùy theo cách AGI được triển khai và các cơ chế kiểm soát đi kèm
    • Tác động nâng cao năng suất có thể rất lớn, nhưng lợi ích cũng có khả năng được phân bổ không đồng đều
    • Những thay đổi về địa chính trị, đạo đức và kinh tế sẽ diễn ra dần dần
    • Giống như cách mạng công nghiệp, chuyển đổi số và cách mạng thuật toán, kết quả không chỉ phụ thuộc vào việc công nghệ có thể làm gì mà còn vào cách xã hội tiếp nhận và điều tiết nó

AI User + Usage + CapEx Growth = Chưa từng có tiền lệ

  • Trong 20 năm qua, CapEx trong lĩnh vực công nghệ đã tăng mạnh theo một quỹ đạo xoay quanh dữ liệu
    • Giai đoạn đầu tập trung đầu tư vào lưu trữ và truy cập, sau đó chuyển sang phân tán/mở rộng, và hiện nay trọng tâm là điện toán/trí tuệ
  • Ở làn sóng thứ nhất, vốn tập trung vào các server farm quy mô lớn, cáp ngầm dưới biển, trung tâm dữ liệu giai đoạn đầu, qua đó Amazon, Microsoft, Google đặt nền móng cho điện toán đám mây
    • Mục tiêu cốt lõi của giai đoạn này là “lưu trữ, tổ chức và cung cấp dịch vụ”
  • Làn sóng thứ hai (đang diễn ra) tập trung vào tăng cường hạ tầng tính toán cho AI workload
    • CapEx của các hyperscaler (nhà vận hành trung tâm dữ liệu siêu quy mô) đang dịch chuyển sang hạ tầng chuyên biệt như GPU, TPU, bộ tăng tốc AI, làm mát bằng chất lỏng, thiết kế trung tâm dữ liệu tiên tiến
    • Năm 2019, AI còn là một chức năng nghiên cứu, nhưng đến năm 2023 đã trở thành hạng mục trọng yếu trong CapEx (chi tiêu vốn)
  • Chủ tịch Microsoft Brad Smith (blog 25/4):
    • “Giống như điện là một công nghệ phổ dụng, AI và các trung tâm dữ liệu đám mây đang đại diện cho giai đoạn công nghiệp hóa tiếp theo”
    Quảng cáo
  • Các tập đoàn big tech toàn cầu đang đầu tư ở quy mô hàng chục nghìn tỷ won mỗi năm
    • Không còn đơn thuần là thu thập dữ liệu, mà khả năng học nhanh, cá nhân hóa sâu và triển khai trên diện rộng đang trở thành cốt lõi của năng lực cạnh tranh
  • Chi tiêu CapEx (đầu tư cơ sở vật chất) của các tập đoàn công nghệ lớn như AWS, NVIDIA, MSFT, Google, Apple, Meta vẫn tăng đều trong nhiều năm qua

Trung tâm dữ liệu = bên hưởng lợi cốt lõi từ chi tiêu AI CapEx

  • Để hiểu tính kinh tế của hạ tầng AI, cần xem xét tốc độ và quy mô xây dựng trung tâm dữ liệu
    • Do nhu cầu bùng nổ xoay quanh AI, CapEx (chi tiêu vốn) cho trung tâm dữ liệu của các công ty IT toàn cầu đã đạt mức cao nhất lịch sử, lên tới 455 tỷ USD vào năm 2024 và vẫn đang tăng tốc
  • Cả hyperscaler lẫn các công ty AI-first đều đầu tư hàng tỷ USD để xây dựng hạ tầng phần cứng hiệu năng cao, tiêu thụ điện lớn cho suy luận thời gian thực và huấn luyện mô hình quy mô lớn, không chỉ riêng lưu trữ
    • Khi AI chuyển từ công nghệ thử nghiệm thành hạ tầng thiết yếu, trung tâm dữ liệu cũng theo đó chiếm vị trí then chốt
    • CEO NVIDIA Jensen Huang nhấn mạnh rằng “giờ đây các trung tâm dữ liệu AI là các nhà máy AI”
  • Trung tâm dữ liệu xAI Colossus tại Memphis, bang Tennessee, Mỹ đã hoàn thành một công trình quy mô 418 căn chỉ trong 122 ngày, đạt tốc độ và hiệu quả chưa từng có (chưa bằng một nửa thời gian xây dựng nhà ở trung bình tại Mỹ)
    • Nhờ các mô-đun chế tạo sẵn, cấp phép nhanh và tích hợp dọc điện/cơ khí/phần mềm, kỷ nguyên xây dựng trung tâm dữ liệu với tốc độ phát triển sản phẩm IT đã bắt đầu
  • CapEx trung tâm dữ liệu được quyết định bởi đất đai, điện năng, chip và thiết bị làm mát, trong khi khối lượng công việc AI tạo ra nhu cầu nhiệt và điện cao hơn rất nhiều so với điện toán doanh nghiệp truyền thống
    • OpEx (chi phí vận hành) chủ yếu xoay quanh chi phí năng lượng và bảo trì hệ thống, đặc biệt các cụm huấn luyện AI mật độ cao vận hành ở tải tối đa liên tục
  • Doanh thu đến từ việc bán compute (AI API, phí nền tảng doanh nghiệp, cải thiện năng suất nội bộ, v.v.), nhưng các công ty xây dựng đón đầu có thể phải đối mặt với thời gian hoàn vốn dài hơn
    • Các công ty mới nổi có thể mất từ vài quý đến vài năm để kiếm tiền sau khi xây dựng hạ tầng
  • Về phía chuỗi cung ứng, việc đảm bảo hạ tầng điện lực (máy biến áp, trạm biến áp, turbine, GPU, cáp, v.v.) đang nổi lên như nút thắt cổ chai mới
    • Trung tâm dữ liệu không chỉ là tài sản vật lý đơn thuần mà còn đóng vai trò là trung tâm hạ tầng chiến lược cho bất động sản, điện lực, logistics, compute và kiếm tiền từ phần mềm
  • Những công ty giải được bài toán phức tạp này một cách đúng đắn sẽ quyết định bản đồ địa lý của nền kinh tế AI trong tương lai

Trung tâm dữ liệu = cỗ máy ngốn điện

  • Mối quan hệ căng thẳng giữa AI và hạ tầng năng lượng đang ngày càng sâu sắc
    • Do AI ngày càng tinh vi, các trung tâm dữ liệu chuyên cho AI đang ghi nhận mức tiêu thụ điện không thua kém các ngành công nghiệp nặng truyền thống
    • Lượng năng lực tính toán khổng lồ cần cho việc huấn luyện và phục vụ mô hình AI là nguyên nhân chính khiến nhu cầu điện tăng vọt
  • Trung tâm dữ liệu chiếm khoảng 1,5% mức tiêu thụ điện toàn cầu trong năm 2024
    • Kể từ năm 2017, mức tiêu thụ điện của trung tâm dữ liệu toàn cầu tăng 12% mỗi năm
    • Cao gấp hơn 4 lần tốc độ tăng của tổng mức tiêu thụ điện
  • Xét theo tỷ trọng tiêu thụ điện theo quốc gia, Mỹ đứng đầu với 45%, tiếp theo là Trung Quốc (25%) và châu Âu (15%)
    • Gần một nửa công suất trung tâm dữ liệu của Mỹ tập trung ở 5 cụm khu vực lớn
    • Các nền kinh tế mới nổi và đang phát triển (trừ Trung Quốc) chiếm 50% người dùng internet nhưng năng lực trung tâm dữ liệu vẫn ở mức dưới 10%
  • Cùng với sự lan rộng của AI, lưới điện (grid) và hạ tầng cung ứng đang nổi lên như nút thắt cổ chai của hiệu năng AI
    • Không còn là dữ liệu hay thuật toán nữa, mà nguồn cung điện đang trở thành rào cản cốt lõi đối với tăng trưởng AI
  • Mặt khác, AI đang thúc đẩy tối ưu hóa vận hành và đổi mới trong ngành năng lượng
    • Tối ưu hóa dựa trên AI đang được áp dụng thực chất trên toàn bộ chuỗi cung ứng năng lượng, từ điện lực, khoáng sản, truyền tải đến tiêu thụ
    • Tuy nhiên, chừng nào nhu cầu AI và chi phí năng lượng còn tiếp tục tăng, các trung tâm dữ liệu rốt cuộc sẽ chỉ phục vụ những khách hàng có khả năng chi trả

Chi phí compute của mô hình AI cao / tiếp tục tăng + chi phí suy luận trên mỗi token giảm = hiệu năng hội tụ + mức sử dụng của nhà phát triển tăng

  • Huấn luyện mô hình ngôn ngữ lớn (LLM) là một trong những công việc tốn kém nhất trong lịch sử loài người, và khi số lượng tham số cùng độ phức tạp thuật toán tăng lên để cải thiện hiệu năng, chi phí huấn luyện đang vọt lên tới hàng tỷ USD
    • Cạnh tranh xây dựng mô hình đa dụng tốt nhất càng khốc liệt thì hiện tượng “hội tụ” càng rõ: việc khác biệt hóa chất lượng đầu ra ngày càng khó hơn và lợi nhuận cũng xấu đi
  • Ngược lại, chi phí suy luận (inference) đang giảm mạnh
    • Ví dụ, GPU NVIDIA Blackwell 2024 có mức tiêu thụ năng lượng trên mỗi token giảm 105.000 lần so với Kepler năm 2014
    • Nhờ đổi mới phần cứng và cải thiện hiệu quả thuật toán mô hình, chi phí suy luận trên mỗi token đang giảm nhanh
  • Việc chi phí suy luận giảm làm cạnh tranh giữa các nhà cung cấp LLM trở nên gay gắt hơn
    • Họ cạnh tranh không chỉ ở độ chính xác mà còn ở độ trễ, tính sẵn sàng và đơn giá trên mỗi token
    • Chi phí tính bằng USD giờ đã giảm xuống mức vài cent và sắp xuống dưới 1 cent
  • Từ góc nhìn người dùng (nhà phát triển), điều này mở ra quyền tiếp cận AI mạnh mẽ với chi phí thấp
    • Việc phát triển dịch vụ và sản phẩm mới được kích hoạt, và người dùng thực tế cũng như mức độ sử dụng đều đang tăng nhanh
  • Với các nhà cung cấp mô hình, một thách thức mới xuất hiện là lợi nhuận suy giảm và thay đổi mô hình kinh doanh
    • Khi huấn luyện đắt mà cung cấp lại rẻ, các chiến lược mới như tích hợp dọc/ngang và thị trường LLM chuyên biệt đang được tìm kiếm
    • LLM đa dụng bắt đầu cho thấy dáng dấp của một cuộc chiến tiêu hao không có lợi nhuận
    • Sự xuất hiện của các mô hình nhỏ và tùy biến đang thúc đẩy các thử nghiệm về cấu trúc doanh thu khác biệt so với các mô hình lớn truyền thống

Chi phí suy luận trên mỗi token đang giảm

  • Việc giảm chi phí suy luận AI đang lặp lại một quy luật tiêu biểu của tiến bộ điện toán
    • Như lời CTO Microsoft Nathan Myhrvold nói năm 1997 rằng “phần mềm giống như khí gas, nó sẽ lấp đầy mọi vật chứa được cho”, AI cũng đang có nhu cầu tăng tới mức sử dụng hết toàn bộ hạ tầng
    • Khi hiệu năng mô hình tốt lên, mức sử dụng (truy vấn, token, số lượng mô hình) tăng bùng nổ, đồng thời phạm vi và tần suất ứng dụng AI cũng mở rộng nhanh chóng
  • Tốc độ phát triển hạ tầng cũng đang ở mức cao nhất từ trước đến nay
    • Năm 2024, GPU NVIDIA Blackwell đã cải thiện hiệu quả năng lượng khi tạo token lên 105.000 lần so với Kepler năm 2014
    • Điều này cho thấy đây không chỉ là giảm chi phí đơn thuần mà là kết quả của đổi mới kiến trúc phần cứng và vật liệu
  • Cải thiện hiệu quả phần cứng là yếu tố cốt lõi để bù đắp gánh nặng điện năng từ nhu cầu AI và internet đang tăng vọt
    • Tuy nhiên, với các cải thiện hiện nay, vẫn chưa thể ngăn chặn hoàn toàn mức tăng của tổng nhu cầu điện
    • Hiện tượng này tương tự với nghịch lý Jevons năm 1865
      • Nghịch lý rằng hiệu quả tài nguyên càng cao thì tổng mức tiêu thụ lại càng tăng cũng đang lặp lại trong AI
  • Kết quả là, công thức công nghệ lâu đời gồm chi phí giảm · hiệu năng tăng · mức sử dụng tăng đang lặp lại trong AI
    • Sự phát triển của hạ tầng lại tiếp tục thúc đẩy gia tăng sử dụng AI, đồng thời làm nảy sinh những trăn trở mới về hạ tầng điện lực và sản xuất năng lượng

Hiệu năng đang hội tụ

  • Hiện tượng hội tụ nhanh ở nhóm dẫn đầu về hiệu năng mô hình AI
    • Theo dữ liệu LMSYS Chatbot Arena của Stanford HAI (2024~2025), điểm đánh giá chatbot của ba mô hình Google, OpenAI, DeepSeek lần lượt là 1.385, 1.366, 1.362, chỉ còn chênh lệch rất nhỏ trong khoảng 1~2%
    • Trong vòng 1 năm, khoảng cách điểm số giữa các mô hình top đầu ngày càng thu hẹp, cho thấy xu hướng cạnh tranh hiệu năng thực chất đang dần bị san bằng
  • Tình hình mà việc khác biệt hóa chất lượng giữa các mô hình ngôn ngữ lớn (LLM) mới nhất ngày càng khó khăn hơn
    • Từ góc nhìn người dùng, môi trường đang hình thành nơi họ có thể cảm thấy rằng “dùng mô hình nào cũng gần như tương tự nhau”
    • Các nhà cung cấp mô hình nhiều khả năng sẽ chuyển sang cạnh tranh bằng các yếu tố ngoài hiệu năng như chi phí, độ ổn định dịch vụ và tính năng chuyên biệt

Mức sử dụng của nhà phát triển tăng

  • Hiện tượng hoạt động của các nhà phát triển AI tăng bùng nổ bắt nguồn từ chi phí suy luận (inference) giảm mạnhkhả năng tiếp cận các mô hình có năng lực được mở rộng
    • Trong giai đoạn 2022~2024, chi phí trên mỗi token để chạy mô hình ngôn ngữ đã giảm khoảng 99,7%
      • Bối cảnh là những bước tiến vượt bậc về phần cứng và hiệu quả thuật toán
      • Công nghệ trước đây chỉ các tập đoàn lớn mới tiếp cận được thì nay nhà phát triển cá nhân, người xây dựng ứng dụng độc lập, nhà nghiên cứu, doanh nghiệp nhỏ cũng có thể dễ dàng tận dụng
    • Sự sụp đổ về chi phí khiến việc thử nghiệm rẻ hơn, còn lặp lại/sản phẩm hóa diễn ra nhanh hơn
      • Chỉ cần có ý tưởng, ai cũng có thể dễ dàng phát triển dịch vụ AI
  • Khi hiệu năng mô hình nhanh chóng hội tụ, công thức lựa chọn mô hình cũng thay đổi
    • Khoảng cách giữa các mô hình lớn hàng đầu và các mô hình thay thế nhỏ hơn, hiệu quả hơn đang thu hẹp
    • Ở nhiều tác vụ thực tế như tóm tắt, phân loại, trích xuất, định tuyến, khác biệt hiệu năng thực tế gần như không còn
    • Giờ đây các nhà phát triển có thể đạt được kết quả tương tự thông qua mô hình giá rẻ hoặc chạy cục bộ/API chi phí thấp thay vì các mô hình premium đắt đỏ
    • Hiệu quả đặc biệt được tối đa hóa khi fine-tune bằng dữ liệu chuyên biệt theo tác vụ
  • Sự thay đổi này làm suy yếu đòn bẩy định giá của tầng lớp “đặc quyền” mô hình và thúc đẩy bình đẳng hóa trong phát triển AI
    • Thay vì phụ thuộc vào một nhà cung cấp (vendor) duy nhất, có thể kết hợp/phân tán việc sử dụng các mô hình từ nhiều hệ sinh thái khác nhau
    • OpenAI ChatGPT, Meta Llama, Mistral Mixtral, Anthropic Claude, Google Gemini, Microsoft Phi, v.v.
      • Có thể chọn mô hình tối ưu phù hợp với nhu cầu kỹ thuật/tài chính trong số các mô hình có thế mạnh khác nhau
    • Thoát khỏi lock-in nền tảng, chuyển sang thời đại của lựa chọn và phân tán do nhà phát triển dẫn dắt
  • Bánh đà tăng trưởng hạ tầng do nhà phát triển dẫn dắt đang hình thành
    • Khi ngày càng nhiều nhà phát triển tạo ra ứng dụng AI-native, hệ sinh thái công cụ/wrapper/thư viện/framework cũng tăng vọt
    • Framework frontend, pipeline embedding, model router, vector DB, lớp phục vụ, v.v.
      • Mỗi làn sóng hoạt động của nhà phát triển lại có tác dụng hạ thấp rào cản gia nhập cho làn sóng tiếp theo
  • Thời gian từ ý tưởng đến nguyên mẫu, từ nguyên mẫu đến sản phẩm đang được rút ngắn
    • Không chỉ chi phí mà cả độ phức tạp cũng đang giảm nhanh
    • Vượt ra ngoài thay đổi của nền tảng, kỷ nguyên bùng nổ sáng tạo đang mở ra
  • Xét về lịch sử, mô hình “nền tảng có nhiều nhà phát triển hơn (và được sử dụng/ứng dụng bền bỉ) cuối cùng sẽ chiến thắng” liên tục lặp lại
    • Như từng thấy trong bài phát biểu “Developers! Developers! Developers!” của Steve Ballmer từ Microsoft, nhà phát triển là lực lượng quan trọng
    • Nền tảng được nhà phát triển chấp nhận, tạo ra quy mô bền vững và thúc đẩy cải tiến liên tục cuối cùng sẽ thống trị thị trường

The AI Developer Next Door

  • Tỷ lệ áp dụng công cụ phát triển AI tăng mạnh (2023~2024, Stack Overflow)
    • So với năm 2023, tỷ lệ nhà phát triển sử dụng công cụ AI đã tăng đáng kể trong năm 2024
    • Với nhà phát triển chuyên nghiệp: 44% → 63%, với người học lập trình: 55% → 65%
  • Kho mã nguồn mở của nhà phát triển AI bùng nổ (GitHub, 2022.11~2024.3)
    • Số lượng repository nhà phát triển AI trên GitHub tăng khoảng 175% trong 16 tháng
    • Sau khi các mô hình/công cụ lớn như ChatGPT, Stable Diffusion xuất hiện, hệ sinh thái phát triển tăng trưởng bùng nổ
  • Hệ sinh thái nhà phát triển AI mở rộng (theo Google, lượng token sử dụng hàng tháng)
    • Từ 10 nghìn tỷ token vào tháng 5/2024 → 480 nghìn tỷ token vào tháng 5/2025, tăng 50 lần chỉ trong 1 năm
    • Mức sử dụng của nhà phát triển tăng mạnh thông qua Google Gemini, AI API, v.v.
  • Tăng trưởng hệ sinh thái Microsoft Azure AI Foundry (lượng token sử dụng theo quý)
    • Từ 20 nghìn tỷ trong quý 1/2024 → 100 nghìn tỷ token trong quý 1/2025, tăng 5 lần
    • Hơn 70.000 doanh nghiệp/nhà phát triển đang sử dụng
  • Đa dạng hóa các trường hợp sử dụng của nhà phát triển AI (năm 2024, theo IBM)
    • AI đang được đẩy nhanh ứng dụng trong nhiều lĩnh vực rộng khắp như tạo mã, phát hiện/sửa lỗi, tự động hóa kiểm thử, quản lý dự án/quy trình làm việc, tài liệu hóa, refactor/tối ưu hóa, tăng cường bảo mật, CI/CD, thiết kế UX, thiết kế kiến trúc, v.v.

AI Usage + Cost + Loss Growth = Unprecedented

  • Quy mô tăng trưởng, chi phí và thua lỗ của AI đang tăng lên đến mức chưa từng có
    • Những tín hiệu rủi ro như “lần này thì khác”, “có thể cân lợi nhuận nhờ kinh tế quy mô”, “sẽ kiếm tiền từ người dùng sau” trước đây thường dẫn đến thất bại, nhưng trong các khoản đầu tư Big Tech cũng đã có những trường hợp thành công thực tế
    • Cuộc cạnh tranh AI lần này có đặc trưng là nguồn vốn ở quy mô chưa từng có và các tập đoàn lớn mang đậm dấu ấn nhà sáng lập cùng lúc tham gia
    • Cạnh tranh giữa các cường quốc toàn cầu như Mỹ, Trung Quốc đang thúc đẩy đổi mới AI tăng tốc
  • Mỗi thời điểm công nghệ lớn được tiếp nhận đều tồn tại một bước ngoặt
    • Máy tính cá nhân có Macintosh (1984)·Windows 3.0 (1990), Internet có IPO của Netscape (1995), di động có iPhone App Store (2008), cloud có AWS (2006~09), AI có NVIDIA A100 (2020), ChatGPT (2022) là các cột mốc mang tính quyết định
    • Năm 2025, sự xuất hiện của DeepSeek từ Trung Quốc là phát súng mở màn cho việc cạnh tranh AI toàn cầu leo thang
  • Nguồn vốn cho tăng trưởng AI đến từ dòng tiền khổng lồ của các tập đoàn công nghệ lớn và nguồn vốn toàn cầu
    • Sự kết hợp giữa cạnh tranh khốc liệt, vốn và tinh thần doanh nhân đang thúc đẩy AI phát triển nhanh hơn
  • Tuy nhiên, mô hình kinh doanh của người chiến thắng cuối cùng vẫn còn chưa rõ ràng

Technology Disruption Pattern Recognition = Hundreds of Years of Consistent Signals

  • Trong lịch sử đổi mới công nghệ, chu kỳ quá nhiệt ban đầu, dòng vốn đổ vào, cạnh tranh gia tăng, phân hóa người thắng kẻ thua liên tục lặp lại
    • Ví dụ: đường sắt thế kỷ 19, bong bóng những năm 1840, kỳ vọng sụp đổ, v.v.
  • Những công nghệ đòi hỏi đầu tư vốn quy mô lớn lúc đầu thường có tỷ suất sinh lời đáng thất vọng, nhưng nếu thành công sẽ thay đổi cấu trúc ngành trong dài hạn
    • Tuy nhiên, nếu không được bảo vệ trước cạnh tranh thì sẽ hàm chứa rủi ro cao
    Quảng cáo
  • Người chiến thắng cuối cùng không phải lúc nào cũng là bên sở hữu công nghệ tốt nhất, mà là chủ thể đọc được dòng chảy của thị trường và ngành rõ ràng nhất
  • Trong thị trường không có rào cản gia nhập, lợi thế đi trước sẽ nhanh chóng biến mất
    • Hãy ghi nhớ bài học rằng “rất khó dự đoán ai sẽ là người chiến thắng của công nghệ mới, nhưng kẻ thua cuộc thì dễ nhận ra”

AI-Related Monetization = Very Robust Ramps

  • Sự tiến hóa của chiến lược phần cứng AI: quyền chủ động trong thiết kế chip đang dịch chuyển từ các vendor truyền thống sang các công ty nền tảng
    • GPU NVIDIA từ lâu đã đóng vai trò động cơ cốt lõi cho huấn luyện/suy luận AI và giành được vị thế vượt trội
    • Do nhu cầu tăng bùng nổ, dù NVIDIA mở rộng sản xuất rất nhanh thì tình trạng thiếu cung vẫn tiếp diễn, khiến các hyperscaler và nhà cung cấp cloud bắt đầu đa dạng hóa chuỗi cung ứng
  • Sự trỗi dậy của chip tùy biến (ASIC): việc áp dụng ASIC được tối ưu cho các phép tính AI cụ thể đang tăng tốc so với GPU đa dụng
    • TPU của Google và chip Trainium của Amazon đã trở thành thành tố cốt lõi trong AI stack của mỗi công ty
      • Amazon Trainium2 mang lại giá/hiệu năng tốt hơn 30~40% so với GPU thông thường, giúp giảm chi phí inference quy mô lớn
    • Các chip tùy biến này không còn là thử nghiệm đơn thuần, mà là chiến lược cốt lõi để kiểm soát hiệu năng, tính kinh tế và kiến trúc
  • Nỗ lực cải thiện tính kinh tế của hạ tầng AI đang lan rộng
    • CEO Amazon Andy Jassy: "AI không nhất thiết phải đắt như hiện nay, và trong tương lai sẽ rẻ hơn"
    • Silicon tùy biến là một trong những phương tiện then chốt để cắt giảm chi phí hạ tầng AI
  • Sự tăng trưởng của các công ty chuyên về hạ tầng AI
    • CoreWeave: tăng trưởng nhanh bằng cách tái cấu trúc chuỗi cung ứng phần cứng game/tiền mã hóa thành cloud GPU cho AI
    • Oracle: chuyển mình từ IT truyền thống sang nền tảng cloud GPU chuyên biệt cho AI
    • Astera Labs: cung cấp thiết bị kết nối siêu tốc giữa GPU và bộ nhớ, góp phần vượt qua giới hạn hiệu năng của các mô hình quy mô lớn
  • Các công ty này không trực tiếp phát triển foundation model, nhưng đang xây dựng hạ tầng thiết yếu cho hệ sinh thái đó
    • Khi nhu cầu tính toán tăng mạnh, tốc độ, khả dụng và hiệu quả nổi lên là những yếu tố cốt lõi của năng lực cạnh tranh

AI Monetization = Chips

  • Doanh thu chip AI của các công ty lớn như NVIDIA, Google, Amazon đang tăng trưởng nhanh
    • Doanh thu theo quý của NVIDIA tăng 78% so với cùng kỳ năm trước, vượt 39 tỷ USD, trong đó mảng chủ lực là trung tâm dữ liệu
    • Trong 10 năm qua, doanh thu của NVIDIA đã tăng gấp 28 lần, còn đầu tư CapEx + R&D của các Big Tech Mỹ (Apple, Microsoft, Alphabet, Amazon, Meta, NVIDIA) cũng tăng gấp 6 lần
    • Doanh thu TPU (Tensor Processing Unit) của Google được ước tính tăng 116% theo năm, đạt quy mô 8,9 tỷ USD
      • Google TPU là chip ASIC chuyên biệt cho huấn luyện mô hình AI, đã sản xuất lũy kế hơn 100.000 chip kể từ khi ra mắt phiên bản đầu tiên vào năm 2015
    • Doanh thu chip AWS Trainium của Amazon được dự báo tăng 216% theo năm, đạt 3,6 tỷ USD vào năm 2025
      • Trainium2 có ưu thế giá/hiệu năng 30~40% so với các instance dựa trên GPU hiện có, đồng thời cung cấp hiệu năng cao hơn tối đa 4 lần
  • Bối cảnh tăng trưởng của thị trường chip AI
    • Khi nhu cầu huấn luyện và suy luận AI tăng vọt, nhu cầu với các chip hiệu năng cao như GPU, ASIC cũng bùng nổ mạnh
    • Các công ty cloud và hyperscaler lớn đang tập trung vào thiết kế chip riêng và củng cố chuỗi cung ứng để nâng cao năng lực cạnh tranh về giá và hiệu quả hạ tầng
    • Các chip chuyên cho AI như GPU, TPU, Trainium đang trở thành nguồn doanh thu cốt lõi của trung tâm dữ liệu và là yếu tố quyết định năng lực cạnh tranh của hạ tầng AI

AI Monetization = Compute Services

  • Sự tăng trưởng của thị trường dịch vụ điện toán AI
    • Công ty cloud chuyên về hạ tầng AI CoreWeave có doanh thu năm 2024 tăng 730% so với cùng kỳ năm trước, đạt 1,9 tỷ USD
    • Tăng trưởng kinh doanh được đẩy nhanh nhờ các hợp đồng lớn với khách hàng chủ chốt như OpenAI, IPO, cùng thương vụ thâu tóm Weights & Biases
    • Khi nhu cầu với hạ tầng cloud hiệu năng cao cho workload AI bùng nổ, các công ty cung cấp hạ tầng tiếp tục ghi nhận tăng trưởng doanh thu siêu tốc
  • Mở rộng thị trường hạ tầng AI
    • Doanh thu hạ tầng AI của Oracle đã tăng gấp 50 lần trong 2 năm, đạt 950 triệu USD vào năm 2024 (ước tính của Morgan Stanley)
    • Do nhu cầu hạ tầng AI gia tăng, các hợp đồng khách hàng mới quy mô lớn đang chờ triển khai, và vẫn còn lượng đặt trước lớn chưa được phục vụ đầy đủ
    • CEO Oracle cho biết làn sóng khách hàng hạ tầng AI đang đổ về, với “hơn 40 hợp đồng mới có giá trị trên 1 tỷ USD”
  • Tăng trưởng của kết nối hạ tầng AI
    • Astera Labs ghi nhận doanh thu năm 2024 tăng 242% so với cùng kỳ năm trước, đạt 396 triệu USD
    • Các dòng sản phẩm kết nối tốc độ cao như PCIe, CXL, Ethernet được triển khai trên nhiều khách hàng và nền tảng, trở thành hạ tầng thiết yếu trong các trung tâm dữ liệu AI như kết nối GPU, cụm tăng tốc AI backend
  • Thu thập dữ liệu AI và siêu máy tính
    • Tesla đã tăng năng lực huấn luyện AI lên 8,5 lần so với tháng 6/2021 (tính đến tháng 9/2024) nhờ siêu máy tính Dojo và triển khai GPU quy mô lớn
    • Dojo được đánh giá có tiềm năng rất lớn không chỉ trong việc đổi mới chi phí huấn luyện nội bộ mà còn có thể chuyển thành dịch vụ bên ngoài tương tự AWS
    • Elon Musk cho biết “tiềm năng của Dojo là rất lớn”

AI Monetization = Data Layer

  • Việc kiếm tiền từ lớp dữ liệu AI đang được đẩy nhanh
  • Scale AI đã tăng doanh thu 160%, từ 335 triệu USD năm 2023 lên 870 triệu USD năm 2024
    • Cung cấp hạ tầng cốt lõi cho việc mở rộng frontier LLM như gán nhãn dữ liệu, đánh giá và xây dựng pipeline
    • Đưa ra tầm nhìn: “Sự dồi dào về dữ liệu là một lựa chọn, và chúng tôi sẽ không để giới hạn của AI bị quyết định bởi sự thiếu hụt dữ liệu”
    • Chỉ riêng các hợp đồng mới trong năm 2024 đã vượt 1,5 tỷ USD
  • VAST Data đã đạt 2 tỷ USD doanh thu lũy kế từ tháng 1/2019 đến tháng 5/2025
    • Đơn giản hóa lớp hạ tầng AI, đồng thời cung cấp dịch vụ lưu trữ, quản lý và xử lý dữ liệu
    • Tầm quan trọng của hạ tầng dữ liệu ngày càng nổi bật cùng với sự trỗi dậy của các mô hình AI reasoning
    • Nhấn mạnh rằng “để hiện thực hóa tiềm năng lớn nhất trong kỷ nguyên AI, điều cốt lõi là đơn giản hóa những vấn đề nền tảng”

Tăng trưởng doanh thu cao, đốt tiền khổng lồ, định giá cao, quy mô đầu tư lớn = tin tốt với người tiêu dùng, còn với phần còn lại thì vẫn chưa chắc

  • Khi nền tảng người dùng số toàn cầu tiếp tục tăng trưởng và khả năng bùng nổ mức sử dụng ngày càng lớn, lĩnh vực đầu tư doanh nghiệp đang trở nên ngày càng cạnh tranh và thâm dụng vốn
    • Sự phá hủy mang tính sáng tạo của chu kỳ công nghệ AI có những điểm tương đồng với quá trình tăng trưởng của các công ty IT lớn trước đây
  • Các ví dụ về những công ty công nghệ lớn trong quá khứ như Apple, Amazon, Google, Uber, Tesla:
    • Apple: từ mức vốn hóa 1,7 tỷ USD vào năm 1997 khi cận kề phá sản, lên 3,2 nghìn tỷ USD hiện nay
    • Amazon: lỗ -545 triệu USD riêng trong năm 2000, lỗ -3 tỷ USD trong 27 quý đầu kể từ khi thành lập, nhưng 27 quý gần đây ghi nhận lợi nhuận ròng 176 tỷ USD, vốn hóa 2,2 nghìn tỷ USD
    • Google: tại thời điểm IPO năm 2004, đã đầu tư 22% doanh thu vào CapEx trên mức doanh thu 390 triệu USD; từ vốn hóa IPO 23 tỷ USD lên 2 nghìn tỷ USD hiện nay
    • Uber: đốt -17 tỷ USD tiền mặt giai đoạn 2016~2022, chuyển sang có lãi lần đầu vào năm 2023; từ vốn hóa IPO 82 tỷ USD lên 189 tỷ USD hiện nay
    • Tesla: đốt -9,2 tỷ USD giai đoạn 2009~2018, chuyển sang có lãi lần đầu vào năm 2019; sau đó ghi nhận 40 tỷ USD lợi nhuận ròng trong 5 năm, vốn hóa hiện tại 1,1 nghìn tỷ USD
  • Tất cả các công ty này đều chấp nhận đầu tư mạnh tay và thua lỗ kéo dài để xây dựng hiệu ứng mạng lưới dựa trên dữ liệulợi thế cạnh tranh dựa trên công nghệ, rồi cuối cùng chứng minh được giá trị trên thị trường
  • Cuối cùng, giá trị doanh nghiệp (valuation) phải được biện minh bằng giá trị hiện tại của dòng tiền tự do tương lai
  • Với lĩnh vực AI cũng vậy, thời gian sẽ chứng minh ai là người chơi cuối cùng có thể tạo ra lợi nhuận bền vững

Usage + Cost + Loss Growth = mức độ chưa từng có tiền lệ… còn khả năng kiếm tiền và lợi nhuận trong tương lai thì sao?

AI Monetization Possibilities = New Entrants & / Or Tech Incumbents?

  • Để hiểu hướng đi của cấu trúc kinh tế mô hình AI, cần xem xét sự căng thẳng giữa năng lực và chi phí
  • Huấn luyện LLM siêu lớn là một trong những nỗ lực tốn kém nhất trong lịch sử loài người, với chi phí tăng vọt lên hàng tỷ USD do số lượng tham số và độ phức tạp kiến trúc gia tăng
  • Trong khi đó, chi phí suy luận (Inference) lại giảm mạnh nhờ đổi mới phần cứng và tối ưu thuật toán
    • Ví dụ: GPU Blackwell 2024 của NVIDIA giúp mức năng lượng trên mỗi token giảm 105.000 lần so với Kepler năm 2014
  • Khi suy luận ngày càng rẻ, cạnh tranh giữa các nhà cung cấp LLM sẽ tăng mạnh ở các yếu tố độ chính xác, độ trễ, khả dụng, chi phí mỗi token, và những tác vụ từng đắt đỏ nay có thể thực hiện với chi phí gần như không đáng kể
  • Với người dùng và nhà phát triển, đơn giá giảm là một cơ hội, kéo theo sự bùng nổ của các dịch vụ và cách sử dụng mới
  • Ngược lại, với các nhà cung cấp mô hình, mô hình kiếm tiền và lợi nhuận trở nên kém chắc chắn hơn
    • Huấn luyện vẫn đắt đỏ trong khi cung cấp dịch vụ (serving) ngày càng rẻ, làm suy yếu quyền định giá
    • Thị trường mô hình nhỏ tùy biến xuất hiện, làm suy yếu moat kinh doanh truyền thống
  • Ví dụ: Google đã đưa AI Overviews vào tìm kiếm từ tháng 5/2024 (1,5 tỷ MAU tính đến tháng 4/2025), và gần đây bắt đầu áp dụng quảng cáo cho một phần người dùng
  • Trong thời gian tới, cạnh tranh sẽ tăng tốc quanh chiến lược nền tảng (mở rộng theo chiều ngang), ứng dụng chuyên biệt, cùng nhiều mô hình kiếm tiền như thuê bao và quảng cáo
  • Trong ngắn hạn, tính kinh tế của LLM đa dụng đang ngày càng tiến gần tới mức lỗ kiểu startup và cạnh tranh hàng hóa hóa

AI – New Entrants = Nhanh chóng đặt nền móng

  • Tình hình triển khai mô hình đăng ký thuê bao cho người dùng của các nhà cung cấp mô hình nền tảng AI chủ chốt (tính đến tháng 5/2025)
    • Nhiều mô hình như OpenAI ChatGPT, xAI Grok, Google Gemini, Anthropic Claude, Perplexity đang cung cấp gói đăng ký miễn phí/trả phí
      • OpenAI ChatGPT: $0 (miễn phí) / $20 (Plus) / $200 (Pro) (theo tháng)
      • xAI Grok: $0 (miễn phí) / $3 (Basic) / $8 (Premium) / $40 (Premium+) (theo tháng)
      • Google Gemini: $0 (miễn phí) / $19.99 (AI Pro) / $250 (AI Ultra) (theo tháng)
      • Anthropic Claude: $0 (miễn phí) / $17 (Plus) / $100 (Max) (theo tháng)
      • Perplexity: $0 (miễn phí) / $20 (Pro) (theo tháng)
  • Tình hình triển khai biểu phí API cho nhà phát triển của các nhà cung cấp mô hình nền tảng AI (tính đến tháng 5/2025)
    • OpenAI, xAI Grok, Google Gemini, Anthropic Claude, Perplexity... đang thu phí theo từng đơn vị gọi API
      • OpenAI ChatGPT: $0.40 (GPT-4.1 nano) ~ $40 (o3) cho mỗi 1 triệu token
      • xAI Grok: $0.50 (grok-3-mini-beta) ~ $25 (grok-3-fast) cho mỗi 1 triệu token
      • Google Gemini: $0.15 (1.5 Flash-8B) ~ $15 (2.5 Pro Preview) cho mỗi 1 triệu token
      • Anthropic Claude: $1.25 (Claude 3 Haiku) ~ $75 (Claude 3 Opus) cho mỗi 1 triệu token
      • Perplexity: $1 (Sonar) ~ $15 (Sonar Pro) cho mỗi 1 triệu token

AI – New Entrants = Rapid Revenue Growth

  • Tăng trưởng số người đăng ký trả phídoanh thu hằng năm của OpenAI (10/2022~4/2025)
    • Số người đăng ký trả phí ChatGPT tăng 153% mỗi năm, đạt khoảng 20 triệu người vào tháng 4/2025
    • Doanh thu hằng năm của OpenAI tăng 1050%, vượt 3,7 tỷ USD vào tháng 4/2025
  • Doanh thu quy đổi theo năm từ API và tìm kiếm tạo sinh của Anthropic tăng 20 lần trong 18 tháng (2 tỷ USD)
    • Chiến lược mô hình mới tập trung vào reasoning như Claude 3.7 Sonnet và việc mở rộng ứng dụng AI vào công việc thực tế
    • Tăng trưởng 6,4 lần trong 1 năm
  • Doanh thu quy đổi theo năm từ tìm kiếm tạo sinh của Perplexity tăng 7,6 lần trong 14 tháng (120 triệu USD)
    • Nhấn mạnh việc cung cấp nguồn dẫn chứng cho mọi câu trả lời và tính năng trợ lý nghiên cứu được cá nhân hóa
  • Doanh thu quy đổi theo năm từ tìm kiếm doanh nghiệp và agent của Glean tăng 10 lần trong 24 tháng (100 triệu USD)
    • Hỗ trợ doanh nghiệp lớn triển khai AI, được thiết kế để tận dụng tri thức trên toàn tổ chức
  • Các công ty AI (top 100) mất trung bình 24 tháng để đạt doanh thu quy đổi theo năm 5 triệu USD
    • Nhanh hơn 35% so với các công ty SaaS truyền thống (trung bình SaaS 37 tháng, AI 24 tháng)

AI –Tech Incumbents = Broad & Steady Product / Feature Rollouts

  • Tình hình người dùng AI toàn cầu và thiết bị của các Tech Incumbent khi so với số người dùng ChatGPT (800 triệu)
    • Google, Meta, Apple, TikTok, Microsoft, Spotify, Amazon, X, Canva... đang dần mở rộng các sản phẩm AI dựa trên nền người dùng từ hàng trăm triệu đến hàng tỷ người
  • Canva – Background Remover & Magic Media (12/19)
    • Tính năng xóa nền ảnh ra mắt năm 2019 duy trì sức hút ổn định, đã được sử dụng lũy kế hơn 3 tỷ lần
    • Magic Media (văn bản → hình ảnh/video) ra mắt năm 2024 đã nhận được phản hồi mạnh mẽ từ cộng đồng, với hơn 290 triệu nội dung được tạo ra chỉ sau 1 năm
  • Spotify – AI DJ (2/23)
    • Các tính năng đổi mới như AI DJ và MV âm nhạc AI được ra mắt trên thị trường toàn cầu từ tháng 2/2023, và đến tháng 5/2024 đã có mặt tại hơn 60 quốc gia
    • AI DJ nâng cao mức độ hài lòng của người dùng và chất lượng dịch vụ Spotify nhờ gợi ý âm nhạc cá nhân hóa, tương tác và khả năng reasoning thời gian thực dựa trên dữ liệu
  • Microsoft – Copilot (2/23)
    • Microsoft đưa Copilot vào Bing và Edge từ tháng 2/2023, ghi nhận hơn 15 tỷ lượt hội thoại lũy kế vào tháng 12/2024
    • Copilot mang đến trải nghiệm người dùng mới dựa trên AI trên toàn bộ web search, trình duyệt và bộ công cụ văn phòng, góp phần nâng cao hiệu suất và sự sáng tạo trong công việc hằng ngày
  • Meta Platforms – Meta AI (9/23)
    • Tính đến tháng 4/2025, Meta AI đạt gần 1 tỷ người dùng hoạt động hằng tháng (MAU) trên toàn bộ các ứng dụng như Instagram, Messenger, WhatsApp
    • Về sau, chiến lược nhấn mạnh mục tiêu giành thế chủ động trong việc phát triển AI agent ở cấp độ kỹ sư tầm trung và ứng dụng AI vào nghiên cứu lẫn thực địa
  • X – Grok (11/23)
    • Grok của xAI, cùng với việc ra mắt phiên bản 3.0 vào tháng 2/2025, đã ghi nhận lượng khách truy cập desktop toàn cầu tăng gấp 42 lần so với tháng trước, vượt 150 triệu
    • AI theo đuổi sự thật (value alignment) và triển khai quy mô lớn được nhấn mạnh, trong khi trải nghiệm AI trong nền tảng X tiếp tục được mở rộng
  • Google – Gemini & AI Overviews (12/23)
    • Tính đến tháng 5/2024, chatbot Gemini có 400 triệu MAU, còn AI Overviews được nhúng vào Google Search và đạt 1,5 tỷ người dùng hằng tháng
    • Điểm mạnh nằm ở mô hình AI đa phương thức bao phủ nhiều loại dữ liệu khác nhau (văn bản, code, hình ảnh, âm thanh...) và tính năng tóm tắt AI trong tìm kiếm
  • Amazon – Rufus (2/24)
    • Amazon triển khai Rufus AI trong lĩnh vực bán lẻ Bắc Mỹ từ tháng 2/2024, cải thiện gợi ý cá nhân hóa trong thông tin sản phẩm, tóm tắt đánh giá...
    • Cùng với tăng trưởng GMV của mảng bán lẻ, mức độ ứng dụng AI cũng đang tiếp tục mở rộng
  • TikTok – Symphony AI Assistant (6/24)
    • Sau khi đưa Symphony Assistant vào hoạt động từ tháng 6/2024, lượng truy cập website toàn cầu của TikTok được ghi nhận vượt 2 tỷ
    • AI đang tạo ra kết quả thực chất trong việc tạo nội dung cho thương hiệu và nhà sáng tạo, hiệu quả quảng cáo và mức độ thiện cảm với thương hiệu
  • Apple – Apple Intelligence (10/24)
    • Từ tháng 9/2024 đến tháng 3/2025, doanh số các thiết bị hỗ trợ Apple Intelligence như iPhone 15 Pro/Pro Max và dòng iPhone 16 đạt từ 50 triệu đến 70 triệu máy
    • Tập trung cung cấp trải nghiệm AI dựa trên cá nhân hóa, quyền riêng tư và tính toán cục bộ thông qua sự kết hợp giữa phần cứng và phần mềm

AI –Tech Incumbents = Rapid Revenue + Customer Growth

  • Doanh thu sản phẩm AI của Microsoft
    • Tính đến năm 2024, ước tính doanh thu hằng năm của mảng sản phẩm AI của Microsoft đạt 13 tỷ USD, tăng 175% so với cùng kỳ năm trước
    • Danh mục sản phẩm AI đa dạng như Azure AI services, Microsoft 365 Copilot, Dynamics 365 Copilot đã thúc đẩy tăng trưởng doanh thu
    • CEO Satya Nadella cho biết công ty đang “nắm bắt cơ hội rất lớn đồng thời hỗ trợ hiện thực hóa lợi tức đầu tư (ROI) từ AI”
    • Trong báo cáo kết quả kinh doanh quý 1 năm 2025, công ty nhấn mạnh rằng commercial bookings đã tăng 18%
  • xAI: Tìm kiếm tạo sinh
    • Trong năm 2025, doanh thu hằng năm của xAI được dự báo sẽ bắt đầu tăng mạnh
    • Mô hình mới nhất Grok 3, dựa trên siêu máy tính Colossus với năng lực tính toán cao hơn hơn 10 lần, đã cải thiện hiệu năng trong các tác vụ suy luận, toán học, lập trình và công việc dựa trên tri thức
    • CEO Elon Musk nhấn mạnh đây là “AI theo đuổi sự thật, ngay cả khi đó là sự thật gây bất tiện về mặt chính trị”
  • Khách hàng thương mại của Palantir tại Mỹ
    • Palantir cho biết số lượng khách hàng thương mại tại Mỹ đã tăng 65% trong vòng một năm, đạt 432 khách hàng
    • Nền tảng AI AIP (Artificial Intelligence Platform) của công ty đã góp phần thu hút khách hàng mới và mở rộng ở khách hàng hiện hữu
    • Tính trên cả năm 2025, doanh thu thương mại tại Mỹ đã vượt 1 tỷ USD
    • Năng lực cạnh tranh của Palantir nằm ở việc “tối đa hóa ngữ cảnh (context) trong doanh nghiệp thông qua AI Ontology và cung cấp năng lực thực thi khác biệt”
    Quảng cáo

Khả năng kiếm tiền từ AI – Doanh nghiệp = Nền tảng ngang và/hoặc phần mềm chuyên biệt?

  • Định hướng kiếm tiền từ AI trong doanh nghiệp
    • Phần mềm kinh doanh truyền thống đã phát triển dưới dạng công cụ chuyên biệt cho từng ngành và nghiệp vụ (Vertical SaaS)
    • Các giải pháp chuyên biệt theo ngành như Toast (nhà hàng), Guidewire (bảo hiểm), Veeva (khoa học sự sống) đang dẫn dắt thị trường
    • Tuy nhiên, sự xuất hiện của foundation model và AI tạo sinh đang mở ra những cơ hội kiếm tiền mới trong nhiều lĩnh vực
  • Sự trỗi dậy của nền tảng ngang
    • Các nền tảng doanh nghiệp dạng ngang đang xuất hiện, tích hợp năng suất AI native, tìm kiếm, giao tiếp và quản lý tri thức vào một giao diện duy nhất
    • Ví dụ: mô hình kết hợp Slack + Notion + ChatGPT, giúp nhúng AI intelligence vào bối cảnh công việc của toàn bộ tổ chức thay vì chỉ từng SaaS riêng lẻ trước đây
    • Giá trị đang dịch chuyển từ mô hình bán giấy phép SaaS sang cơ chế tính phí dựa trên đầu ra được AI tích hợp
  • Cạnh tranh giữa nền tảng ngang và phần mềm chuyên biệt
    • Microsoft đang tích hợp Copilot trên toàn doanh nghiệp, còn Zoom/Canva thì kết hợp AI tạo sinh vào quy trình làm việc của người dùng
    • Databricks và các công ty khác đang tích hợp AI vào stack dữ liệu và developer
    • Các startup như Glean đang thách thức mô hình suite truyền thống bằng quy trình làm việc AI-first
    • Trong khi đó, các nhà cung cấp phần mềm chuyên biệt hiện hữu cũng đang đáp trả bằng cách nhanh chóng nhúng AI, tự động hóa workflow và triển khai mô hình được tùy biến bằng dữ liệu theo từng ngành
    • Các nhà cung cấp chuyên biệt này đã sẵn có niềm tin, dữ liệu có cấu trúc và workflow hiện trường, nên có lợi thế trong triển khai AI theo từng domain
  • Triển vọng sắp tới
    • Nền tảng ngang có thế mạnh ở việc tích hợp đa chức năng và kết nối tri thức toàn doanh nghiệp
    • Các nhà cung cấp chuyên biệt khác biệt hóa bằng các tính năng AI chuyên sâu phù hợp với quy định, hợp đồng và bối cảnh khách hàng của từng ngành
    • Yếu tố then chốt là ai có thể trừu tượng hóa lớp cốt lõi, đồng thời chiếm lĩnh giao diện người dùng và logic công việc
    • Kiếm tiền trong kỷ nguyên AI sẽ không được quyết định chỉ bởi mức sử dụng, mà bởi 'Attention', 'Context' và 'Control'

Những người chơi SaaS hiện hữu (Incumbents)

  • Microsoft GitHub Copilot
    • Chính thức ra mắt vào tháng 6 năm 2022
    • Được triển khai tại hơn 77.000 doanh nghiệp
    • Tăng trưởng 180% so với cùng kỳ trong 2 năm
    • Cộng đồng 150 triệu nhà phát triển, tăng 50% trong 2 năm
    • Doanh thu hằng năm hơn 500 triệu USD (tính theo quý)
  • Microsoft 365 Copilot
    • Công bố vào tháng 3 năm 2023, bắt đầu cung cấp chính thức cho doanh nghiệp vào tháng 11 năm 2023
    • Trong quý đầu tiên sau khi ra mắt, nhiều khách hàng hiện hữu đã mở rộng số ghế hơn 10 lần
    • Số người dùng tăng hơn gấp đôi theo từng quý
    • Tỷ lệ sử dụng của nhân viên cũng tăng vọt, gần đây tăng hơn 60%
    • Hơn 75% CIO có kế hoạch triển khai trong vòng 12 tháng tới
  • Adobe Firefly
    • Public beta vào tháng 3 năm 2023, thương mại hóa mô hình AI video vào tháng 2 năm 2024
    • Được các thương hiệu và nhà sáng tạo đánh giá cao
    • Tổng số tài sản được tạo bằng Firefly đã vượt 20 tỷ
    • Hơn 90% người dùng trả phí đã trải nghiệm tạo video
    • Người dùng hoạt động hằng tháng của Photoshop/Lightroom GenAI lần lượt đạt 35% và 30%
  • Atlassian Intelligence
    • Beta vào tháng 12 năm 2023, vượt 1 triệu MAU vào tháng 12 năm 2024
    • Mức sử dụng tính năng AI tăng 25 lần chỉ trong một năm
    • Hơn 10% khách hàng đã triển khai Atlassian Intelligence
  • Zoom AI Companion
    • Ra mắt vào tháng 9 năm 2023, được triển khai trên 3,5 triệu tài khoản vào tháng 12 năm 2024
    • Số tài khoản hoạt động tăng 68% theo từng quý
    • AI Companion 2.0 cung cấp các tính năng nâng cao như memory/reasoning/integration
  • Canva Magic Studio
    • Ra mắt vào tháng 10 năm 2023, đến tháng 5 năm 2025 đã ghi nhận lũy kế 16 tỷ lượt sử dụng công cụ AI
    • Được sử dụng trên toàn bộ cộng đồng sáng tạo/doanh nghiệp/phi lợi nhuận
    • Ghi nhận hơn 10 tỷ lượt sử dụng công cụ AI
  • Salesforce Agentforce
    • Công bố vào tháng 9 năm 2024, tính đến tháng 2 năm 2025 đã ký 3.000 hợp đồng trả phí
    • Kết hợp với Data Cloud để đổi mới trải nghiệm khách hàng ở quy mô lớn
    • Duy trì đà tăng trưởng AI ARR trên 120% mỗi năm

OpenAI ChatGPT = Nền tảng doanh nghiệp dạng ngang tiềm năng?

  • Microsoft Office Suite
    • Gồm 9 ứng dụng (Outlook, Word, Excel, PowerPoint, v.v.)
    • Thu hút hơn 400 triệu người dùng trả phí trong 34 năm (1990~2024)
  • OpenAI ChatGPT
    • Dù chỉ là một ứng dụng đơn lẻ, vẫn đạt 20 triệu người dùng trả phí chỉ trong 2,5 năm (tháng 11 năm 2022 ~ tháng 4 năm 2025)
  • Mở rộng ChatGPT Enterprise
    • Chỉ sau 9 tháng ra mắt, đã được các nhóm trong hơn 80% công ty Fortune 500 triển khai
    • Các doanh nghiệp sử dụng cho biết họ ưa chuộng cách triển khai dễ dàng và an toàn
    • Các doanh nghiệp sử dụng sớm đang tích cực tận dụng ChatGPT Enterprise để cải thiện giao tiếp nội bộ, tăng tốc công việc lập trình, trả lời nhanh các câu hỏi kinh doanh phức tạp và hỗ trợ công việc sáng tạo
    • ChatGPT Enterprise không có bất kỳ giới hạn sử dụng nào và cung cấp hiệu năng nhanh gấp tối đa 2 lần so với phiên bản miễn phí
    • Cũng cho phép truy cập không giới hạn vào tính năng phân tích dữ liệu nâng cao (trước đây là Code Interpreter)
    • Trong giai đoạn từ tháng 8 năm 2023 đến tháng 2 năm 2025, số người dùng doanh nghiệp/nhóm/giáo dục đã tăng nhanh lên 2 triệu

Phần mềm chuyên biệt được AI hỗ trợ trong các ngành dịch vụ lớn = Tăng trưởng rất nhanh

  • Kỹ thuật phần mềm
    • Cursor AI: đạt ARR (doanh thu định kỳ hằng năm) từ $1M → $300M chỉ trong 25 tháng
    • Cursor là trình soạn thảo mã AI, mang lại trải nghiệm người dùng mang tính đột phá trong viết mã, refactor và tự động hóa
    • Chỉnh sửa hơn 1 tỷ ký tự mỗi ngày, ghi nhận hơn $100M doanh thu định kỳ
  • Phát triển sản phẩm (No-Code Product-Building)
    • Lovable: ARR tăng gấp 13 lần trong 5 tháng, đạt $50M
    • Nền tảng no-code dựa trên AI tự động tạo mọi thứ từ mã frontend/backend, tích hợp DB đến triển khai khi nhập ý tưởng sản phẩm bằng ngôn ngữ tự nhiên
    • Hỗ trợ bất kỳ ai nhanh chóng tạo sản phẩm và bắt đầu kinh doanh
  • Y tế (đối thoại lâm sàng)
    • Abridge: CARR (doanh thu định kỳ theo hợp đồng) tăng từ $50M → $117M trong 5 tháng
    • Được hơn 25.000 nhân viên y tế, 40 bệnh viện và 600 tổ chức y tế áp dụng, đã được dùng hơn 10 triệu lần để tóm tắt hồ sơ thăm khám bệnh nhân
    • Nhận được nhiều phản hồi tích cực từ đội ngũ y tế sử dụng
  • Pháp lý (tự động hóa workflow)
    • Harvey: ARR tăng từ $10M → $70M trong 15 tháng, có 235 khách hàng tại 42 quốc gia
    • Được phần lớn 10 hãng luật hàng đầu Mỹ áp dụng, dẫn dắt đổi mới tự động hóa workflow dịch vụ pháp lý/chuyên môn và hiệu quả vận hành
  • Hỗ trợ khách hàng (AI Support Agents)
    • Decagon: ARR tăng khoảng từ $1M → $10M chỉ trong 1 năm
    • Tác nhân hỗ trợ AI tự động hóa công việc lặp lại, chuyển vai trò hỗ trợ khách hàng sang vai trò quản lý AI
    • Dự kiến tiếp tục tăng trưởng trong năm 2025
  • Dịch vụ tài chính (nghiên cứu và phân tích)
    • AlphaSense: ARR tăng khoảng từ $150M → $420M trong 2 năm
    • Insight dựa trên AI đang trở thành tiêu chuẩn của thị trường, cung cấp giải pháp thông tin thị trường và workflow nâng cao
    • Tập trung vào đổi mới sản phẩm và đầu tư công nghệ, tiếp tục tăng trưởng nhanh trong năm 2025

Các mối đe dọa đối với việc kiếm tiền từ AI = Cạnh tranh gia tăng + Động lực mã nguồn mở + Sự trỗi dậy của Trung Quốc

Cạnh tranh gia tăng = các đợt phát hành mô hình AI

  • Kể từ bài báo transformer “Attention is All You Need” của Google năm 2017, làn sóng đổi mới AI đầu tiên xoay quanh LLM (mô hình ngôn ngữ lớn) đã bắt đầu
    • GPT-3 của OpenAI, Llama-1 của Meta và các mô hình khác đã chứng minh khả năng suy luận đa dụng thông qua huấn luyện dự đoán văn bản quy mô lớn
  • Tuy nhiên, giao tiếp của con người không chỉ giới hạn ở văn bản
    • Hình ảnh, âm thanh, video, dữ liệu cảm biến và nhiều tín hiệu khác truyền tải ngữ cảnh tình huống thực tế một cách phong phú hơn
    • Nhiều công ty như Google, Anthropic, xAI đang mở rộng mô hình ngôn ngữ sang multimodal (xử lý nhiều định dạng dữ liệu)
      Sự tiến hóa của mô hình AI multimodal
    • Tích hợp và hiểu/tạo thông tin văn bản, ảnh, giọng nói, video trong một không gian vector duy nhất
    • Với một truy vấn, có thể đồng thời tham chiếu đoạn văn + biểu đồ, và trả lời bằng tóm tắt giọng nói hoặc hình ảnh có chú thích
    • Cấu trúc cho phép tự do chuyển qua lại giữa mọi định dạng dữ liệu mà không cần chuyển đổi hệ thống
  • Các ví dụ tiến hóa chính theo từng giai đoạn
    • 2021 OpenAI CLIP: tích hợp thị giác + ngôn ngữ
    • 2023 Meta ImageBind, 2024 Chameleon: hợp nhất hình ảnh, âm thanh, video
    • 2024-2025 GPT-4o, Claude 3, Chameleon: xuất hiện các mô hình frontier multimodal hoàn chỉnh
  • Hiệu quả trong thực tiễn
    • Kỹ sư hiện trường dùng camera smartphone để kiểm tra chẩn đoán bất thường thiết bị theo thời gian thực
    • Nhân viên y tế đính kèm X-ray và đồng thời tạo bản nháp báo cáo khám chữa bệnh có cấu trúc
    • Chuyên viên phân tích truy vấn biểu đồ, bản ghi âm và audio clip cùng lúc để phân tích tổng hợp
    • Giảm context switching so với mô hình dựa trên văn bản, nắm bắt thông tin phong phú hơn và thúc đẩy đổi mới dịch vụ lấy thị giác/giọng nói làm trung tâm

Động lực của mô hình mã nguồn mở

  • Phát triển mô hình AI trong giai đoạn đầu (2012-2018) chủ yếu xoay quanh mã nguồn mở
    • Dựa trên văn hóa học thuật và hợp tác, mô hình, mã nguồn và dữ liệu được công khai
  • Từ sau năm 2019, do thương mại hóa, bảo mật và cạnh tranh gay gắt, mô hình khép kín (closed-source) xuất hiện
    • Từ thời điểm GPT-2 được công bố, trọng số và dữ liệu huấn luyện của các mô hình chủ chốt dần không còn được công khai
    • OpenAI GPT-4, Anthropic Claude và các mô hình khác được phục vụ dưới dạng API với dữ liệu độc quyền quy mô lớn và lượng vốn đầu tư lớn
    • Có thế mạnh về hiệu năng, khả năng sử dụng và độ tin cậy nên được doanh nghiệp lớn, chính phủ và người tiêu dùng ưa chuộng
    • Ngược lại, hạn chế nằm ở sự thiếu minh bạch về dữ liệu huấn luyện, cấu trúc mô hình và cách fine-tuning
  • Gần đây, các mô hình mã nguồn mở đang trỗi dậy trở lại
    • Chi phí phát triển và sử dụng thấp, khả năng tiếp cận cao nên được startup, nhà phát triển và giới học thuật ưa chuộng
    • Thông qua các nền tảng như Hugging Face, có thể dễ dàng tải xuống/sử dụng các mô hình mới nhất như Meta Llama, Mistral Mixtral
    • Việc phát triển AI đang mở rộng từ các phòng thí nghiệm khổng lồ trở lại các phòng thí nghiệm dựa trên cá nhân và cộng đồng
    • Đổi mới được tăng tốc nhờ thử nghiệm nhanh, hợp tác và sự tham gia của cộng đồng
  • Trung Quốc đứng số 1 thế giới về số lượng mô hình AI lớn mã nguồn mở được công bố tính đến năm 2025
    • Các mô hình lớn như DeepSeek-R1, Alibaba Qwen-32B, Baidu Ernie 4.5 đã được công bố trong năm 2025
  • Sự phân hóa rõ rệt giữa closed-source và open-source
    • Mã nguồn mở: dẫn dắt sovereign AI, mô hình ngôn ngữ bản địa hóa và đổi mới dựa trên cộng đồng
    • Closed-source: chiếm ưu thế ở thị trường tiêu dùng và triển khai doanh nghiệp lớn, tập trung vào tối ưu hóa và khả năng sử dụng
    • Hai hệ hình đối đầu giữa cởi mở/tốc độ/tự do và bảo mật/tối ưu hóa/kiểm soát đang cạnh tranh để định hình tương lai AI

Hiệu năng mô hình mã nguồn mở tăng lên + Chi phí token giảm xuống = Bùng nổ mức sử dụng bởi các nhà phát triển dùng AI

  • Ban đầu, các mô hình closed-source như GPT-4, Claude, Gemini dẫn dắt thị trường tiêu dùng và doanh nghiệp lớn
    • Có lợi thế về nhận diện đại chúng và mức độ triển khai trong doanh nghiệp nhờ onboarding dễ dàng, UI/UX gọn gàng và độ tin cậy cao
    • Cung cấp bảo mật, tính tiện dụng và tên tuổi thương hiệu để cả nhân sự không chuyên kỹ thuật cũng có thể dễ dàng sử dụng
  • Gần đây, khoảng cách hiệu năng của mô hình mã nguồn mở đang thu hẹp nhanh chóng
    • Llama 3, DeepSeek và các mô hình khác đã đạt mức có thể cạnh tranh với mô hình khép kín ở suy luận, lập trình, đa ngôn ngữ
    • Có thể tự do tải xuống, fine-tuning và triển khai cục bộ, trong khi chi phí rẻ hơn rất nhiều
  • Việc chấp nhận mô hình AI mã nguồn mở đang tăng tốc, lấy nhà phát triển làm trung tâm
    • Nhà phát triển ưu tiên khả năng tùy biến và chi phí thấp/hiệu năng cao hơn là UX hoàn thiện
    • Các thử nghiệm đổi mới dựa trên mô hình mã nguồn mở đang diễn ra sôi động trong nhiều lĩnh vực như app, agent, pipeline
  • Nhờ giá token giảm và hiệu năng mô hình mã nguồn mở tăng, số lượng nhà phát triển tận dụng AI tăng bùng nổ
    • Trước đây phụ thuộc nhiều vào API khép kín, nhưng giờ đây có thể tự xây dựng/mở rộng trực tiếp cả trên local lẫn cloud
  • Vẫn còn giới hạn trong việc phổ cập tới người tiêu dùng/doanh nghiệp lớn
    • Mã nguồn mở còn yếu ở sức mạnh thương hiệu, UX thân thiện người dùng và dịch vụ managed
    • Tuy nhiên, nếu hạ tầng trở nên thuận tiện hơn và khoảng cách chi phí/hiệu năng được duy trì, khả năng lan sang thị trường đại chúng là có thể xảy ra

Sự trỗi dậy của Trung Quốc

  • Meta CTO Andrew Bosworth hiện ví AI như một “cuộc chạy đua không gian” (space race), đồng thời đánh giá rất cao năng lực của Trung Quốc
    • Giống như cuộc chạy đua không gian trước đây mang tính cạnh tranh giữa các thể chế về tốc độ đổi mới và mức độ tín nhiệm toàn cầu, cuộc cạnh tranh AI cũng có thể ảnh hưởng đến trật tự thế giới
  • Trung Quốc đã nhanh chóng chuyển mình từ sản xuất giá rẻ sang quốc gia dẫn dắt công nghệ cao nhờ chính sách ‘Made in China 2025’
    • Nhanh chóng củng cố năng lực trong các ngành chiến lược xoay quanh robot, điện khí hóa, công nghệ thông tin và AI đẳng cấp thế giới
  • Ứng dụng AI của Trung Quốc trong quân sự và chiến lược quốc gia
    • Việc sử dụng AI đang được mở rộng trên toàn bộ lĩnh vực an ninh quốc gia như hậu cần chiến trường, nhận diện mục tiêu, tác chiến mạng và các nền tảng ra quyết định tự động
    • Năm 2025, truyền thông nhà nước nhấn mạnh việc áp dụng AI cả trong các lĩnh vực hỗ trợ quân đội (phi chiến đấu), ví dụ như bệnh viện quân đội
    • Bộ Khoa học và Công nghệ đã nêu rõ ‘đổi mới tự chủ’ (indigenous innovation) là nhiệm vụ cốt lõi của quốc gia
  • Tác động toàn cầu từ lợi thế AI của Trung Quốc
    • Trong một bài viết năm 2024, Sam Altman của OpenAI cảnh báo rằng “nếu các chế độ độc tài giành ưu thế trong AI, họ có thể ép các công ty Mỹ và các nước khác chia sẻ dữ liệu, đồng thời sử dụng AI để giám sát người dân hoặc phát triển vũ khí mạng”
  • Cạnh tranh bá quyền công nghệ Mỹ - Trung ngày càng sâu sắc
    • Không chỉ AI mà cuộc cạnh tranh giành quyền kiểm soát còn mở rộng sang đất hiếm, chất bán dẫn và các lĩnh vực công nghệ cao
    • Trung Quốc duy trì vị thế cường quốc toàn cầu về nguồn cung đất hiếm (vật liệu cốt lõi cho điện tử tiên tiến, quốc phòng và năng lượng sạch), còn Mỹ tăng cường kiềm chế bằng cách đưa sản xuất chất bán dẫn trở lại trong nước (reshoring) và củng cố hợp tác với các đồng minh như Nhật Bản, Hàn Quốc và Hà Lan
    • TSMC của Đài Loan là trụ cột then chốt của ngành foundry bán dẫn toàn cầu, nằm ở trung tâm trong tính toán chiến lược của cả Mỹ lẫn Trung Quốc
  • Thay đổi trong định hướng chính sách tại Mỹ
    • Sau 20 năm phản ứng tương đối dè dặt, cả hai đảng hiện đều chủ động nhìn nhận các ngành công nghệ cao là ‘lợi ích cốt lõi của quốc gia’
    • Chính quyền Biden: kiểm soát xuất khẩu; chính quyền Trump: chủ nghĩa dân tộc kinh tế và reshoring, cùng nhiều cách tiếp cận khác nhau
    • Các thượng nghị sĩ John Cornyn và Mark Warner: “Đổi mới bán dẫn của Mỹ đã chống đỡ toàn bộ nền kinh tế, nhưng sự tự mãn đã tạo cơ hội để các đối thủ cạnh tranh, kể cả các nước thù địch, bắt kịp”
  • Tầm quan trọng của việc bảo vệ tài sản trí tuệ (IP) công nghệ của Mỹ
    • OpenAI cho biết “các đối thủ như Trung Quốc liên tục tìm cách đảo ngược kỹ thuật các mô hình AI hàng đầu của Mỹ, và việc hợp tác chặt chẽ với chính phủ là điều thiết yếu”
  • Thay đổi trong cách nhìn về quan hệ Mỹ - Trung
    • Không giống giai đoạn đầu sau khi gia nhập WTO (những năm 2000), nước Mỹ hiện nay đã nhận thức rõ rằng công nghệ cao như AI, chất bán dẫn và khoáng sản thiết yếu không chỉ là tài sản kinh tế - công nghiệp mà còn là trụ cột cốt lõi của năng lực phục hồi quốc gia và sức mạnh địa chính trị

Lãnh đạo vốn hóa thị trường đại chúng kể câu chuyện 30 năm qua = Động lực phi thường của nước Mỹ…Trung Quốc trỗi dậy

  • Trong 30 năm qua (1995~2025), trong top 30 công ty có vốn hóa thị trường lớn nhất toàn cầu, chỉ có 6 công ty duy trì được vị trí liên tục
    • Microsoft, Walmart, Exxon Mobil, Procter & Gamble, Johnson & Johnson, Coca-Cola
    • Các công ty mới lọt vào nhóm dẫn đầu
      • NVIDIA, Apple, Amazon, Alphabet(Google), Saudi Aramco, Meta Platforms(Facebook), Tesla, Broadcom, Berkshire Hathaway, TSMC, JP Morgan Chase, Visa, Eli Lilly, Tencent, Mastercard, Netflix, Costco Wholesale, Oracle, Home Depot, SAP, Bank of America, ICBC, AbbVie, Palantir
    • Tỷ trọng theo quốc gia năm 1995
      • Mỹ: 53% (16 trong 30 công ty),
      • Nhật Bản: 9 công ty,
      • Thụy Sĩ: 3 công ty,
      • Anh: 2 công ty
    • Tỷ trọng theo quốc gia năm 2025
      • Mỹ: 83% (25 trong 30 công ty)
      • Nhật Bản/Thụy Sĩ/Anh: 0 công ty
      • Trung Quốc 2 công ty, Saudi Arabia 1 công ty, Đài Loan 1 công ty, Đức 1 công ty
      Quảng cáo
  • Trong 30 năm qua, trong top 30 công ty công nghệ toàn cầu (tech companies) theo vốn hóa thị trường, chỉ có 5 công ty duy trì được vị trí liên tục
    • Microsoft, Oracle, Cisco, IBM, AT&T
    • Các công ty công nghệ mới gia nhập
      • NVIDIA, Apple, Amazon, Alphabet(Google), Meta Platforms(Facebook), Tesla, Broadcom, TSMC, Tencent, Netflix, SAP, Palantir, ASML, Alibaba, Salesforce, T-Mobile, Samsung, China Mobile, Reliance, ServiceNow, Intuitive Surgical, Siemens, Uber, AMD, Intuit
    • Tỷ trọng theo quốc gia của các công ty công nghệ năm 1995
      • Mỹ: 53% (16/30),
      • Nhật Bản: 30% (9/30),
      • Anh/Singapore/Hồng Kông/Mexico/Malaysia mỗi nước 1 công ty
    • Tỷ trọng theo quốc gia của các công ty công nghệ năm 2025
      • Mỹ: 70% (21/30)
      • Nhật Bản/Anh/Singapore/Hồng Kông/Mexico/Malaysia: 0 công ty
      • Trung Quốc 3 công ty, Đức 2 công ty, Đài Loan 1 công ty, Hà Lan 1 công ty, Hàn Quốc 1 công ty, Ấn Độ 1 công ty
    • TSMC của Đài Loan: tuy Đài Loan chỉ có 1 công ty trong nhóm dẫn đầu (TSMC), nhưng tính đến quý 2 năm 2024
      • Sản xuất 80~90% chất bán dẫn tiên tiến của thế giới và hơn 62% tổng lượng chất bán dẫn
  • Một sự thay đổi khổng lồ diễn ra chỉ trong một thế hệ
    • Sự phổ cập của Internet đã trở thành nền tảng cho sự ra đời của các doanh nghiệp toàn cầu mới trong nhóm dẫn đầu,
    • Và sự trỗi dậy của AI được dự báo sẽ thúc đẩy những thay đổi còn nhanh hơn và mang tính căn bản hơn trong 30 năm tới

Mỹ vs. Trung Quốc trong công nghệ = Tốc độ phản ứng AI của Trung Quốc nhanh hơn đáng kể so với Internet năm 1995

  • Vị thế dẫn đầu về mô hình ngôn ngữ lớn (LLM): Mỹ và Trung Quốc đang dẫn dắt tốc độ phát triển AI toàn cầu
    • Xét tình hình xây dựng các hệ thống AI quy mô lớn tích lũy giai đoạn 2017~2024, Mỹ và Trung Quốc đang dẫn trước một cách vượt trội
    • Tính đến năm 2024, Mỹ đã công bố hơn 150 hệ thống AI quy mô lớn, còn Trung Quốc cũng vượt mốc 100
    • Pháp, Anh, Canada, Hong Kong, Đức... vẫn còn khoảng cách lớn so với Mỹ và Trung Quốc
  • China AI = đuổi kịp nhanh, DeepSeek R1
    • DeepSeek công bố rằng năng lực phát triển AI của Trung Quốc đã thu hẹp khoảng cách với Mỹ xuống còn 3 tháng (tháng 1/2025)
    • CEO DeepSeek nhấn mạnh rằng Trung Quốc không thể chỉ dừng ở việc mô phỏng mà buộc phải tiến tới đổi mới độc lập
  • Alibaba Qwen 2.5-Max: tuyên bố vượt DeepSeek·OpenAI ChatGPT
    • Qwen2.5-Max đã thể hiện hiệu năng vượt DeepSeek V3 và OpenAI ChatGPT trên nhiều benchmark khác nhau
    • Hiệu năng mô hình đang tiếp tục được cải thiện nhờ mở rộng dữ liệu, tăng kích thước mô hình và đổi mới kỹ thuật post-training
  • Baidu Ernie 4.5 Turbo: AI đa phương thức, chi phí thấp·hiệu năng cao
    • Đây là AI multimodal có thể xử lý cả văn bản·hình ảnh·video, được ví như một “dao quân đội Thụy Sĩ”
    • Chi phí ở mức RMB 0.8 cho mỗi 1 triệu token đầu vào, RMB 3.2 cho đầu ra, tương đương 40% chi phí của DeepSeek V3 và 0.2% của GPT-4.5
    • Đạt mức tương đương GPT-4.1 và thể hiện hiệu năng vượt GPT-4o trong một số tác vụ đa phương thức
  • Hiệu năng LLM: Mỹ và Trung Quốc đang thu hẹp khoảng cách điểm số thực tế
    • Theo kết quả Chatbot Arena của Stanford HAI & LMSYS tính đến tháng 2/2025, Mỹ đạt 1.385 điểm, Trung Quốc đạt 1.362 điểm, chênh lệch rất sát
  • AI Trung Quốc: đạt hiệu năng với chi phí huấn luyện thấp
    • Theo dữ liệu của Epoch AI, các mô hình Trung Quốc như DeepSeek V3 đã được phát hành với chi phí thấp hơn đáng kể so với GPT-4
  • Chuyển sang huấn luyện AI bằng bán dẫn nội địa
    • Do các hạn chế xuất khẩu từ Mỹ, các cụm chip AI nội địa như của Huawei đang mở rộng nhanh chóng
    • Theo Financial Times, Huawei đang bắt đầu cung cấp quy mô lớn các cụm AI cho doanh nghiệp công nghệ Trung Quốc
  • Trung Quốc: nền tảng lắp đặt robot công nghiệp cũng ở mức cao nhất thế giới
    • Tính đến năm 2023, Trung Quốc đạt 276 nghìn chiếc, phần còn lại của thế giới là 265 nghìn chiếc, còn Mỹ vào khoảng 40 nghìn chiếc
  • Kết luận: tốc độ đổi mới AI của Trung Quốc nhanh hơn rất nhiều so với giai đoạn đầu phổ cập internet (1995)
    • Trung Quốc đang nhanh chóng thu hẹp khoảng cách với Mỹ về công nghệ, chi phí và hạ tầng, khiến cuộc cạnh tranh giành quyền dẫn dắt ngành công nghiệp toàn cầu ngày càng khốc liệt hơn

Mức độ sử dụng AI tiêu dùng tại Trung Quốc = DeepSeek tăng trưởng nhanh chóng

  • Thị trường AI tạo sinh toàn cầu ngày càng phân hóa theo khu vực, kênh và sở thích người dùng
    • Trên toàn cầu, ChatGPT của OpenAI vẫn giữ vị trí số 1 rõ rệt trên cả desktop lẫn mobile, nhưng cạnh tranh theo từng nền tảng đang ngày càng gay gắt
    • Claude của Anthropic và Gemini của Google cũng đang dần mở rộng thị phần, trong khi Grok của xAI được ghi nhận là trợ lý AI tăng trưởng nhanh nhất với mức tăng khách truy cập hàng tháng 294% tính đến giai đoạn tháng 2~3/2025
  • Trung Quốc: các mô hình AI nội địa như DeepSeek đang chiếm ưu thế
    • ChatGPT đứng đầu ở đa số quốc gia, nhưng tại Nga và Trung Quốc, dịch vụ này không khả dụng, nên các mô hình nội địa như DeepSeek trở thành xu hướng chủ đạo
    • Theo Roland Berger, toàn bộ TOP10 ứng dụng AI tại Trung Quốc tính theo người dùng hoạt động hàng tháng đều là sản phẩm nội địa (DeepSeek, Kimi, Nami AI, ERNIE Bot... với hàng chục triệu người dùng)
    • Ở phần còn lại của thế giới ngoài Trung Quốc, ChatGPT áp đảo rõ rệt; còn trong nội địa Trung Quốc, một thị trường hoàn toàn tách biệt đã hình thành
  • Môi trường và quy định nền tảng tại Trung Quốc
    • Facebook, Twitter, Google, YouTube đã không thể truy cập tại Trung Quốc từ năm 2010 hoặc sớm hơn
    • Không chỉ Instagram, WhatsApp, Wikipedia, Telegram, Spotify, mà gần đây cả ChatGPT, Google Gemini, Claude, Meta AI, Microsoft Copilot cũng bị chặn
    • Môi trường quản lý này đã thúc đẩy sự trỗi dậy của các nhà vô địch AI nội địa
  • Khác biệt trong nhận thức về AI
    • Theo khảo sát của Stanford HAI và Ipsos, 83% công dân Trung Quốc đánh giá tích cực tác động ròng của AI (tính đến năm 2024, tăng 5 điểm phần trăm so với 2022)
    • Tại Mỹ, chỉ 39% người dân trả lời tích cực cho cùng câu hỏi, hầu như không thay đổi trong 2 năm
    • Xét ở góc độ xã hội và triết học, cách tiếp cận và chấp nhận AI khác nhau giữa các quốc gia
  • Việc lựa chọn nền tảng đang dần mở rộng vượt ra ngoài hiệu năng hay giá cả, tiến tới cả phạm vi của bản sắc quốc gia·văn hóa
    • Điểm phân nhánh quan trọng không còn đơn thuần là “ai làm tốt hơn”, mà là “con người tiếp nhận và sử dụng như thế nào”

AI & Physical World Ramps = Fast + Data-Driven

  • Cho đến nay, trọng tâm là mở rộng AI và thương mại hóa trong phần mềm desktop/mobile, nhưng đổi mới và thương mại hóa AI trong thế giới vật lý thực tế đang diễn ra còn nhanh hơn và mạnh mẽ hơn thế
    • Giờ đây, trí thông minh không chỉ được tích hợp sâu vào các ứng dụng số mà còn vào xe cộ, máy móc và hệ thống quốc phòng
    • Các đội xe tự hành như Waymo, Tesla không còn là dự án trong phòng thí nghiệm, mà đang thực sự tạo doanh thu, tích lũy hàng triệu dặm dữ liệu lái không người lái và tiến hóa nhanh thành các vòng lặp phần mềm ngày càng tinh vi
    • Applied Intuition phát triển hệ thống xe được định nghĩa bằng phần mềm không phụ thuộc phần cứng và nền tảng mô phỏng, giúp nhà sản xuất có thể áp dụng AI dễ dàng như một linh kiện
    • Trong ngành công nghiệp quốc phòng (Anduril), AI đang chuyển đổi mô hình phòng thủ bằng cách xuất xưởng các hệ thống tự hành có AI được gắn trên mọi nút biên (drone, cảm biến, v.v.)
    • Trong nông nghiệp (Carbon Robotics), với computer vision dựa trên AI để loại bỏ cỏ dại mà không dùng thuốc diệt cỏ, thế giới vật lý đang bước vào một cuộc chuyển đổi lớn, nơi tài sản vốn sẽ trở thành các endpoint phần mềm
    • Điều này cho thấy AI không còn chỉ dừng lại trên màn hình mà đang trở thành một lực lượng vận động thế giới thực (kinetic)
  • Tesla Vertically-Integrated Electric Vehicles
    • Từ tháng 6/2022 đến tháng 3/2025, tổng quãng đường chạy Full Self-Driving đã tăng gấp 100 lần
    • Với việc đưa vào phiên bản 12, 330.000 dòng mã C++ được thay thế bằng neural net, áp dụng kiến trúc AI end-to-end hoàn chỉnh
    • AI đóng vai trò trung tâm ở mọi giai đoạn như nhận diện vật thể, lập kế hoạch lộ trình và điều khiển phương tiện
    • Tesla có thể là công ty suy luận AI hiệu quả nhất thế giới
  • Waymo Fully-Autonomous Vehicles
    • Từ 8/2023 đến 4/2025, thị phần rideshare tại San Francisco tăng vọt từ 0% lên 27%
    • Xây dựng hệ thống thương mại vững chắc dựa trên AI đa phương thức cho perception, planning và prediction
    • Chứng minh được sản phẩm xe tự hành có thể thương mại hóa thành công trên thị trường thực
  • Applied Intuition Vehicle Intelligence
    • Tính đến năm 2024, cung cấp giải pháp AI vehicle intelligence cho 18 OEM ô tô lớn trên toàn cầu
    • Mở rộng nền tảng mô phỏng và phần mềm tự hành sang nhiều ngành như ô tô, xe tải, xây dựng và quốc phòng
    • Trong lĩnh vực quốc phòng, tăng cường danh mục sản phẩm công nghệ quốc phòng và tự hành off-road
  • Anduril AI-Enabled Autonomous USA Defense Systems
    • Trong 2 năm liên tiếp 2022~2024, doanh thu hằng năm tăng gấp đôi, vượt 1 tỷ USD vào năm 2024
    • Tận dụng AI và hệ thống tự hành để hỗ trợ ra quyết định nhanh hơn và chính xác hơn trong môi trường chiến trường hiện đại
    • Triển khai AI trên từng nút biên phân tán để đổi mới hệ thống an ninh và phòng thủ
  • KoBold Metals AI-Driven Mining Exploration
    • Với công nghệ machine prospector dựa trên AI, hiệu quả thăm dò trong lĩnh vực khai phá khoáng sản vốn ở mức thấp nhất kể từ năm 1975 đã được cải thiện mạnh mẽ
    • Kết hợp dữ liệu địa lý/địa vật lý quy mô lớn với các mô hình tương quan thống kê để nhanh chóng xác định các ứng viên thăm dò triển vọng
    • Đảm bảo chuỗi cung ứng kim loại mới với hiệu quả cao hơn hơn 2 lần mức trung bình của ngành
  • Carbon Robotics AI-Driven Agricultural Modernization
    • Từ tháng 1/2023 đến tháng 5/2025, đã làm cỏ trên hơn 230.000 mẫu Anh cộng dồn, ngăn việc sử dụng hơn 100.000 gallon glyphosate (thuốc diệt cỏ)
    • Dùng công nghệ deep learning và computer vision dựa trên AI để loại bỏ cỏ dại quanh cây trồng bằng laser
    • Máy móc tự động có thể xử lý 2 mẫu Anh mỗi giờ, loại bỏ 200.000 cỏ dại mỗi ngày
  • Halter AI-Driven Intelligent Grazing
    • Tính đến năm 2025, số hợp đồng mới cho vòng cổ thông minh dùng cho trang trại tăng hơn 150% mỗi năm
    • Quản lý chăn thả dựa trên AI giúp tối ưu hiệu quả sử dụng tài nguyên, cải thiện sức khỏe đất và tăng cường tính bền vững
    • Chứng minh tác động quy mô lớn về năng suất và giảm phát thải carbon, góp phần phá vỡ thực trạng ứng dụng công nghệ chậm chạp trong nông nghiệp hiện đại

Tăng trưởng người dùng Internet toàn cầu được thúc đẩy bởi AI ngay từ đầu = Mức tăng trưởng chưa từng thấy trước đây

  • Sự phổ biến của Internet vệ tinh chi phí thấp đang nhanh chóng mở ra khả năng 2,6 tỷ người chưa được kết nối, tương đương 32% dân số thế giới, sẽ lần đầu lên mạng
  • Khác với trước đây, họ sẽ bắt đầu trải nghiệm Internet đầu tiên trong trạng thái đã tích hợp sẵn các tính năng AI
  • Thay vì gõ trực tiếp vào ô tìm kiếm hoặc đi qua trình duyệt truyền thống, họ được kỳ vọng sẽ trò chuyện với AI bằng ngôn ngữ tự nhiên để lấy thông tin và sử dụng nhiều dịch vụ công nghệ khác nhau ngay từ đầu
  • Giao diện dựa trên AI agent như vậy có thể dồn giá trị thị trường về cho những người chơi sở hữu giao diện, thay vì app, và làm rung chuyển trật tự của các nền tảng hiện có
  • Trong tương lai, sở hữu giao diện sẽ quan trọng hơn sở hữu nền tảng, và AI hiểu ngôn ngữ địa phương, ngữ cảnh cùng ý định người dùng sẽ trở thành năng lực cạnh tranh cốt lõi

Tăng trưởng người dùng Internet mới = Được kích hoạt bởi AI + vệ tinh

  • Orbital / Satellite Launch Market Share, Global = SpaceX Rising
    • Kể từ năm 2008, một thời kỳ phục hưng các vụ phóng không gian thương mại và quốc gia đã bắt đầu, và SpaceX chiếm tỷ trọng lớn trong số lần phóng hằng năm
    • Mỹ (không tính SpaceX), Trung Quốc và Nga cũng cho thấy tăng trưởng riêng, nhưng đà tăng mạnh của SpaceX đặc biệt nổi bật
    • Từ thời Cold War đến cuối những năm 1990 là giai đoạn do nhà nước dẫn dắt, còn gần đây xu hướng là các vụ phóng do khu vực tư nhân dẫn dắt tăng lên
  • SpaceX Starlink @ 5MM+ Subscribers = +202% Annual Growth Over 3.2 Years
    • Số thuê bao Starlink tăng từ khoảng 100.000 vào năm 2021 lên hơn 5 triệu vào năm 2024
    • Ghi nhận tốc độ tăng trưởng trung bình hằng năm 202%, nhanh chóng mở rộng tệp người dùng Internet toàn cầu
  • SpaceX Starlink Ecosystem = Coverage Expanding Globally
    • Tính đến năm 2025, Starlink đã mở rộng vùng dịch vụ sang Bắc Mỹ, Nam Mỹ, châu Âu, châu Đại Dương, một phần châu Phi và các khu vực chính tại châu Á
    • Các quốc gia chưa được phục vụ hiện vẫn còn hạn chế, như Trung Quốc, Nga, Iran
  • Starlink = Unlocking Previously-Inaccessible Internet Access in AI Era
    • Coco, Monterrey, Mexico: Cung cấp Internet tốc độ cao, đáng tin cậy cho khu vực nông thôn Mexico, mở rộng khả năng tiếp cận số thông qua WiFi cộng đồng
    • Chile School District: Cung cấp Internet tốc độ cao để cả 36 máy tính của trường học tại Chile có thể kết nối đồng thời, giúp học sinh và giáo viên cùng trải nghiệm môi trường học tập đổi mới
    • Brightline Trains, USA: Cung cấp Internet vệ tinh ổn định trên tuyến đường sắt cao tốc tại Mỹ, nâng cao trải nghiệm hành khách và hiệu quả vận hành
    • Seaspan Corporation, Global: Triển khai Internet vệ tinh cho hãng vận tải biển toàn cầu, biến tàu thuyền thành văn phòng từ xa, cải thiện an toàn cho thủy thủ đoàn và hiệu quả vận hành, hiện thực hóa những giải pháp trước đây không thể làm được

AI & Work Evolution = Thực tế + Nhanh chóng

  • Sự thay đổi mang tính bản chất của công việc do AI thúc đẩy
    • Cùng với tự động hóa vật lý như robot, drone, tự động hóa nhận thức cũng đang lan rộng rất nhanh
    • Các hệ thống AI đang mở rộng phạm vi công việc khi sở hữu năng lực suy luận, sáng tạo, giải quyết vấn đề
  • Tốc độ tăng trưởng năng lực nhận thức của AI
    • Trong 3 năm sau khi ChatGPT ra mắt (tháng 11/2022), AI đã phát triển từ mức học sinh trung học lên năng lực suy luận cấp độ tiến sĩ
    • Các công việc mang tính quy tắc và phán đoán dựa trên lượng lớn dữ liệu có cấu trúc đang dịch chuyển thành thế mạnh của AI
  • Sự thay đổi về đơn vị lao động
    • Có khả năng chuyển từ lao động lấy con người làm trung tâm trước đây sang mô hình lấy năng lực tính toán của trung tâm dữ liệu và mô hình AI làm trung tâm
    • Kỷ nguyên mà hạ tầng AI quyết định nguồn cung và chất lượng của một số loại lao động cụ thể đang dần xuất hiện
  • Tương lai dựa trên agent và vai trò của con người
    • Một số ý kiến dự báo AI agent sẽ thay thế các nghề nghiệp văn phòng
    • Tuy nhiên, cũng cần cân nhắc mô hình lịch sử cho thấy khi năng suất và hiệu quả tăng lên, các công việc mới cho con người cũng xuất hiện
    • Ngay cả trong một xã hội hoàn toàn lấy agent làm trung tâm, vai trò của con người như giám sát, huấn luyện, chỉ dẫn vẫn sẽ còn tồn tại
  • Cấu trúc lao động tương lai và thay đổi xã hội
    • Tương tự RLHF (học tăng cường từ phản hồi của con người), con người sẽ chuyển sang vai trò huấn luyện, tinh chỉnh hiệu năng của AI và robot
    • Trong lịch sử, thay đổi cách thức làm việc luôn lặp lại nhiều lần, và AI cũng là công nghệ thúc đẩy năng suất và sự tiến hóa của công việc

Summary

  • Cũng như khó có thể tưởng tượng một cuộc sống không có internet, trong tương lai cũng sẽ khó hình dung một thế giới không có AI
    • AI đang nhanh chóng trở thành hạ tầng cốt lõi của toàn bộ ngành công nghiệp như hỗ trợ khách hàng, phát triển phần mềm, khoa học, giáo dục và sản xuất
  • Các yếu tố thúc đẩy tăng tốc phổ cập AI
    • Sự lan rộng toàn cầu của các công cụ AI đa phương thức như ChatGPT, chi phí suy luận giảm, cùng việc ra mắt nhiều mô hình đa dạng đang đóng vai trò thúc đẩy
    • Từ nhà phát triển cá nhân đến các tập đoàn lớn, việc tiếp cận và thử nghiệm trở nên dễ dàng hơn, qua đó đẩy nhanh sự lan tỏa của đổi mới
  • Hạ tầng công nghệ và đầu tư
    • Chi tiêu vốn của các nhà cung cấp cloud lớn, hãng bán dẫn và hyperscaler đang tăng vọt
    • Ranh giới giữa vật lý và số trong các hệ thống như chip, trung tâm dữ liệu, mạng lưới và năng lượng đang ngày càng mờ đi
  • Cạnh tranh chiến lược Mỹ - Trung và quyền dẫn dắt AI toàn cầu
    • Mỹ đang dẫn đầu về đổi mới mô hình, chip tùy biến và hạ tầng cloud, nhưng Trung Quốc cũng đang tăng trưởng nhanh nhờ mã nguồn mở, hạ tầng và hỗ trợ chính sách
    • Cả hai nước đều xem AI là đòn bẩy cốt lõi cho tăng trưởng kinh tếảnh hưởng địa chính trị
  • Thay đổi về nền tảng và giao diện
    • AI đang vượt ra ngoài hệ sinh thái ứng dụng truyền thống để tiến hóa thành giao diện hội thoại dựa trên agent
    • Nhờ internet vệ tinh và các công nghệ tương tự, nhiều người dùng internet mới trong tương lai có khả năng bắt đầu trực tiếp với trải nghiệm AI-native
  • Sự thay đổi về việc làm và cách thức làm việc
    • Việc triển khai AI tại nơi làm việc đang tăng tốc, với đơn vị lao động dần chuyển từ con người sang năng lực tính toán và AI
    • Ngày càng nhiều người làm việc cùng AI, và xu hướng AI tái cấu trúc môi trường làm việc đang hiện rõ
  • Sự kết hợp giữa tình hình quốc tế và công nghệ
    • Dòng chảy thông tin và vốn, công nghệ bị vũ khí hóa, cùng sự đối đầu ngày càng sâu sắc giữa dân chủ và chủ nghĩa độc đoán đang làm gia tăng bất ổn
    • Tuy nhiên, đổi mới là cốt lõi của năng lực cạnh tranh quốc gia, và điều quan trọng là triển khai nhanh cùng chiến lược liên minh
  • Kết luận
    • Thời khắc của AI đã đến, và nó đang ngày càng mạnh mẽ hơn
    • Genie sẽ không quay trở lại chiếc chai nữa (đã vượt qua điểm không thể quay đầu)

1 bình luận

 
xguru 2025-06-02

Cũng được công bố dưới dạng tệp PDF: https://www.bondcap.com/report/pdf/Trends_Artificial_Intelligence.pdf