- AI Index 2026 là báo cáo tổng hợp xu hướng chung của AI qua các chỉ số như hiệu năng benchmark, đầu tư, nhận thức của công chúng, năng lực compute và phát thải carbon
- Việc ra mắt các mô hình AI đáng chú ý tiếp tục tập trung ở Mỹ và khối công nghiệp, trong khi Trung Quốc ghi nhận ưu thế rõ rệt về lắp đặt robot công nghiệp
- Năng lực compute AI toàn cầu đã tăng hơn 3 lần mỗi năm kể từ 2022, và GPU Nvidia hiện chiếm hơn 60 phần trăm tổng năng lực
- Hiệu năng benchmark của LLM đa phương thức và agentic AI tăng nhanh, nhưng ở các tác vụ phổ thông như đọc đồng hồ kim thì độ chính xác vẫn thấp
- Đầu tư AI trong năm 2025 vượt 581 tỷ USD, lập mức cao nhất từ trước đến nay; tác động đến việc làm, niềm tin vào quy định và mức độ chấp nhận của công chúng khác biệt lớn tùy quốc gia và chỉ số
- Báo cáo AI Index 2026 dài hơn 400 trang của Stanford tổng hợp hiện trạng AI từ nhiều góc độ như điểm benchmark, đầu tư và nhận thức của công chúng
- Hiệu năng mô hình AI dẫn đầu tiếp tục tăng tốc, và các công ty AI lớn như OpenAI và Anthropic đang hướng tới IPO trong nửa cuối năm nay
- Tâm lý phản cảm với AI cũng vẫn tiếp diễn; đặc biệt tại Mỹ, chính quyền địa phương bắt đầu chấp nhận các biện pháp hạn chế hoặc cấm hoàn toàn việc phát triển các trung tâm dữ liệu mới
- Tiếp nối các bài tổng hợp xu hướng của những năm trước từ 2021 đến 2025, đây là phần chọn lọc các xu hướng cô đọng hiện trạng AI năm 2026
Ưu thế về mô hình AI của Mỹ
- Mỹ đã dẫn dắt việc phát hành các mô hình AI đáng chú ý trong suốt 10 năm qua, và xu hướng đó vẫn tiếp tục trong năm 2025
- Theo Epoch AI, số mô hình đáng chú ý do các tổ chức tại Mỹ phát hành trong năm 2025 là 50 mô hình
- Sản lượng của Trung Quốc bắt đầu thu hẹp khoảng cách
- Gần như toàn bộ các mô hình đáng chú ý đều đến từ khối công nghiệp
- Trong năm 2025, số lần phát hành mô hình đáng chú ý của khối công nghiệp là 87
- Tổng số phát hành từ các nguồn khác, gồm học thuật và cơ quan chính phủ, là 7
- Tỷ trọng của khối công nghiệp đã mở rộng mạnh trong dài hạn
- Các mô hình do khối công nghiệp phát hành hiện chiếm hơn 90 phần trăm số mô hình đáng chú ý
- Năm 2015 là dưới 50 phần trăm, còn năm 2003 là 0
Ưu thế của Trung Quốc trong triển khai robot
- Doanh nghiệp Mỹ dẫn trước về số lượng mô hình AI đáng chú ý, nhưng Trung Quốc có ưu thế vượt trội ở triển khai robot
- Theo dữ liệu của International Federation of Robotics, số robot công nghiệp được lắp đặt tại Trung Quốc trong năm 2024 là 295.000 chiếc
- Nhật Bản lắp khoảng 44.500 chiếc, còn Mỹ là 34.200 chiếc
Compute AI toàn cầu tăng vọt
- Chỉ số tổng năng lực compute AI của Epoch AI được đưa ra như thước đo đại diện cho sự mở rộng của hạ tầng AI
- Trên biểu đồ lấy hiệu năng H100e của Nvidia làm mốc chuẩn, năng lực compute AI toàn cầu đã tăng hơn 3 lần mỗi năm kể từ 2022
- Nếu lấy 2021 làm năm bắt đầu theo dõi, tổng compute AI đã tăng 30 lần
- Nvidia là bên hưởng lợi lớn nhất từ đợt mở rộng này
- GPU Nvidia hiện chiếm hơn 60 phần trăm tổng năng lực compute AI toàn cầu
- Amazon và Google, hai công ty tự thiết kế phần cứng AI, đứng sau đó
Phát thải carbon từ huấn luyện và suy luận AI
- Lượng phát thải carbon trong quá trình huấn luyện AI đã là vấn đề được chỉ ra từ những năm trước, và sang 2026 mối lo này vẫn tiếp diễn
- Việc huấn luyện các mô hình ngôn ngữ lớn frontier mới nhất được ước tính tạo ra lượng phát thải rất lớn
- Mức phát thải ước tính của quá trình huấn luyện Grok 4 của xAI vượt 72.000 tấn quy đổi carbon
- OpenAI GPT-4 được ước tính ở mức 5.184 tấn, còn Meta Llama 3.1 405B là 8.930 tấn
- Ray Perrault cho biết các con số này chỉ là ước tính và cần thận trọng khi diễn giải
- “These estimates should be interpreted with caution”
- Với Grok, có độ bất định lớn vì các đầu vào phần nhiều được suy ra từ bài viết của Forbes, phát biểu của xAI và các nguồn khác không thể kiểm chứng
- Epoch AI còn ước tính độc lập lượng phát thải của Grok 4 cao hơn, ở khoảng 140.000 tấn CO₂
- Phát thải từ suy luận AI cũng đang tăng và khác biệt giữa các mô hình là rất lớn
- Mô hình suy luận kém hiệu quả nhất có lượng phát thải cao gấp hơn 10 lần mô hình hiệu quả nhất
- DeepSeek V3 được ước tính tiêu thụ khoảng 23 watt khi trả lời prompt có độ dài trung bình
- Claude 4 Opus được ước tính tiêu thụ khoảng 5 watt
Hiệu năng benchmark của LLM tăng tốc
- Trong 10 năm qua, hiệu năng mô hình AI đã cải thiện rất nhanh, và trên biểu đồ tốc độ tiến bộ này còn đang tăng thêm
- Đặc biệt, LLM đa phương thức tiến bộ đến mức gần như chinh phục ngay lập tức các benchmark mới được tạo ra
- Mức tăng mạnh nhất nằm ở mảng agentic AI
- Hai đường tăng dốc ở phía bên phải biểu đồ là benchmark OSWorld, dùng để đánh giá khả năng sử dụng máy tính tự động
- Và benchmark kỹ nghệ phần mềm SWE-Bench Verified, dùng để đánh giá khả năng lập trình tự động
- Hiệu năng trên Humanity’s Last Exam cũng tăng nhanh
- Trong Stanford AI Index 2025, mô hình đứng đầu là OpenAI o1 với tỷ lệ trả lời đúng 8,8 phần trăm
- Sau đó, độ chính xác đã tăng lên tới 38,3 phần trăm
- Tính đến tháng 4/2026, các mô hình đạt điểm cao nhất như Anthropic Claude Opus 4.6 và Google Gemini 3.1 Pro đều vượt 50 phần trăm
- Ray Perrault cũng lưu ý về mối tương ứng giữa benchmark và hiệu năng thực tế
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- Ông nhắc rằng chỉ riêng mức chính xác 75 phần trăm trên benchmark suy luận pháp lý là chưa đủ để biết liệu nó có phù hợp với công việc thực tế của một hãng luật hay không
Mở rộng nghiên cứu AI trong y tế
- Việc áp dụng AI trong nghiên cứu y tế đang tăng nhanh
- Số lượng bài báo về khám phá thuốc dựa trên AI đã tăng hơn gấp đôi trong 2 năm qua
- Số bài báo về AI y sinh đa phương thức, kết hợp xử lý hình ảnh y khoa và văn bản, đã tăng 2,7 lần so với 2 năm trước
Giới hạn trong việc đọc đồng hồ kim
- Trái với sự cải thiện nhanh ở một số lĩnh vực, các điểm yếu vẫn tồn tại ở các tác vụ phổ thông như đọc đồng hồ kim và hiểu lịch
- Trên ClockBench, benchmark đo khả năng đọc đồng hồ kim của LLM đa phương thức, ngay cả mô hình tốt nhất cũng chỉ có xác suất thành công khoảng một nửa
- OpenAI GPT-5.4 có xác suất trả lời đúng là 50-50
- Phần lớn mô hình có kết quả thấp hơn nhiều
- Anthropic Claude Opus 4.6 chỉ đạt độ chính xác 8,9 phần trăm
- Cùng mô hình này lại được nhắc đến là đạt điểm hàng đầu trên Humanity’s Last Exam
- Ray Perrault liên hệ điều này với một vấn đề tổng quát hơn
- Khi đặt câu hỏi đòi hỏi kết hợp ngôn ngữ với các modality khác như hình ảnh hay ngữ điệu giọng nói, thành phần ngôn ngữ lại chiếm tỷ trọng lớn hơn dự kiến
- Ông cũng nhắc tới các hướng nghiên cứu cho thấy hệ thống có thể đi tới mức gần như bỏ qua hoàn toàn thông tin phi ngôn ngữ
Đầu tư AI lập đỉnh trong năm 2025
- Cùng với việc hiệu năng mô hình AI tăng lên, đầu tư AI cũng tăng theo
- Theo dữ liệu của công ty phân tích AI Quid, đầu tư AI trong năm 2025 đạt mức kỷ lục hơn 581 tỷ USD
- Cao hơn gấp đôi mức 253 tỷ USD của năm 2024
- Đồng thời vượt xa mức đỉnh trước đó là 360 tỷ USD vào năm 2021
- Khác với năm 2021, kỷ lục năm 2025 không do M&A mà chủ yếu do đầu tư tư nhân vào các công ty AI dẫn dắt
- Phần lớn vốn đầu tư chảy vào Mỹ
- Trong năm qua, tổng đầu tư AI tại Mỹ vượt 344 tỷ USD
Kỹ sư phần mềm tập trung vào AI
- Trên GitHub, số lượng dự án liên quan đến AI đã tăng vọt lên 5,58 triệu vào năm 2025
- Cao gấp khoảng 5 lần so với năm 2020
- Tăng 23,7 phần trăm so với năm 2024
- Mức tăng này dường như không chỉ là do làn sóng dự án do AI tạo ra
- Số dự án có từ 10 sao trở lên cũng tăng với tốc độ tương tự
- Tổng số sao mà các dự án AI nhận được cũng tăng với tốc độ tương tự
- Điều đó cho thấy vẫn có sự tham gia của con người
- Một ví dụ tiêu biểu là phần mềm agentic AI mã nguồn mở OpenClaw
- Dự án này đạt 352.000 stars trên GitHub
- Ray Perrault thừa nhận rằng các dự án bot hay agent AI có thể góp phần tạo nên sức nóng này
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Ông cũng nhắc rằng theo trang theo dõi hoạt động Agents in the Wild, vốn không được đề cập trong báo cáo của Stanford, phần lớn hoạt động trên GitHub có vẻ vẫn do con người thực hiện
- Các bài báo khoa học máy tính cũng cho thấy sức nóng của AI
- Số bài báo khoa học máy tính liên quan đến AI đã tăng hơn gấp đôi trong 10 năm qua, từ 102.000 lên 258.000
- Tính đến năm 2024, hơn 68 phần trăm trong số này đến từ giới học thuật
- Tỷ trọng của chính phủ và khối công nghiệp lần lượt vào khoảng 11,5 phần trăm và 12,5 phần trăm
- Tăng trưởng được dẫn dắt bởi các lĩnh vực machine learning, computer vision và generative AI
Tác động của AI đến việc làm vẫn chưa rõ ràng
- Cùng với sự lan rộng của AI tạo sinh, lo ngại về việc làm gia tăng, nhưng dữ liệu hiện tại cho ra kết quả pha trộn
- Báo cáo đưa ra biểu đồ số nhân sự chuẩn hóa theo độ tuổi của các nhóm nghề được xem là có rủi ro cao bị AI thay thế như software developers và customer support agents
- Việc làm cho người mới vào nghề giảm
- Vị trí trung cấp và senior được duy trì hoặc tăng lên
- Rất khó diễn giải các thay đổi này nếu tách khỏi các xu hướng kinh tế rộng hơn
- Báo cáo cho biết tỷ lệ thất nghiệp tăng trên nhiều nhóm nghề
- Trái với dự đoán, mức tăng thất nghiệp của nhóm lao động có mức tiếp xúc với AI thấp nhất lại lớn hơn nhóm có mức tiếp xúc với AI cao nhất
Thay đổi trong nhận thức của công chúng về AI
- Trong khảo sát của Ipsos, sự lạc quan về AI đã tăng nhẹ nhưng đáng chú ý trong vài năm gần đây
- Tỷ lệ trả lời “benefits outweigh the drawbacks” tăng từ 55 phần trăm năm 2024 lên 59 phần trăm
- Tỷ lệ cho rằng mình “good understanding” về AI tăng nhẹ từ 67 phần trăm lên 68 phần trăm
- Ở các câu hỏi tương tự, mức chấp nhận tổng thể vẫn nghiêng về tích cực hơn tiêu cực, nhưng một số cảm xúc tiêu cực cũng tăng
- 52 phần trăm người trả lời cho biết các sản phẩm và dịch vụ dùng AI khiến họ cảm thấy “nervous”
- Chênh lệch giữa các quốc gia là rất lớn
- Trung Quốc cùng các nước Đông Nam Á như Malaysia, Thailand, Indonesia và Singapore có xu hướng tích cực hơn
- Mức chuyển biến tích cực lớn nhất theo năm thuộc về Germany 12 phần trăm, France 10 phần trăm và the Netherlands 10 phần trăm
- Colombia ghi nhận mức chuyển biến tiêu cực mạnh nhất với -6 phần trăm
Khác biệt theo quốc gia về niềm tin vào quản lý AI
- Cùng với nhận thức ngày càng tăng rằng AI có thể tạo tác động tích cực, ở một số quốc gia cũng tồn tại sự mất lòng tin sâu sắc vào năng lực quản lý của chính phủ
- Mỹ là trường hợp tiêu biểu: dù dẫn đầu về đầu tư AI, mức tin tưởng vào quản lý lại nằm trong nhóm thấp nhất
- Trong khảo sát của Ipsos, chỉ 31 phần trăm người trả lời tại Mỹ nói rằng họ tin tưởng chính phủ có thể quản lý AI
- Nhiều nước châu Âu và Nhật Bản cũng có mức tin tưởng thấp
- Các quốc gia ở châu Á và Nam Mỹ lại có mức tin tưởng cao nhất vào năng lực quản lý AI của chính phủ
- Sự đối lập giữa Mỹ và Colombia đặc biệt nổi bật
- Tại Mỹ, có sự mất lòng tin sâu sắc vào quản lý AI, nhưng đa số người trả lời vẫn cho rằng lợi ích của AI lớn hơn bất lợi
- Tại Colombia, niềm tin vào quản lý AI cao nhưng cảm nhận chung về AI lại xấu đi
- Như một phiên bản thu nhỏ của câu chuyện AI năm 2025, chất lượng hiệu năng mô hình và nhận thức về tác động xã hội thay đổi rất mạnh tùy theo từng tác vụ và từng câu hỏi
1 bình luận
Ý kiến trên Hacker News
Tôi muốn chỉ ra rằng nhận thức của giới trẻ về AI không hẳn là sáng sủa như nhiều người nghĩ. Nếu nhìn vào khảo sát của Gallup, có thể thấy sự hoài nghi là khá rõ ràng
Dù việc huấn luyện một frontier LLM mới nhất có tạo ra hơn 72 nghìn tấn khí thải carbon, tôi vẫn nghĩ đó là tương đối nhỏ nếu so với quy mô 38 tỷ tấn mỗi năm trên toàn cầu
Rốt cuộc tôi cho rằng sẽ không ai thật sự có hào lũy moat, nên biểu đồ này chỉ càng cho thấy sự ngộ nhận của nhà đầu tư
Dù mảng robotics dẫn đầu của China cũng đáng chú ý, nhưng điều đầu tiên đập vào mắt tôi lại là biểu đồ phát thải của Grok
Chỉ vì số dự án GitHub được tạo ra tăng mà nói rằng "các kỹ sư phần mềm đã all-in vào AI" thì nghe khá buồn cười. Tạo một repository đâu có khiến ai đó trở thành kỹ sư phần mềm, nếu vậy thì có khi chẳng cần học gì khác nữa
Phần "China đang dẫn đầu về robotics" có vẻ chẳng liên quan nhiều đến AI. Biểu đồ của China gần như đi theo cùng một quỹ đạo từ năm 2012, nên tôi cảm thấy biểu đồ đó không thật sự khớp với ngữ cảnh bài viết
Câu "việc huấn luyện mô hình AI có thể thải ra lượng carbon rất lớn" là đúng, nhưng thứ tôi thật sự muốn xem là biểu đồ về lượng carbon phát sinh khi vận hành dịch vụ các mô hình này trên quy mô toàn cầu
Tôi khó đồng ý với câu "trong 10 năm qua, hiệu năng mô hình AI đã cải thiện với tốc độ đáng kinh ngạc, và tiến bộ đó còn đang tăng tốc". Theo tôi, gần như mọi lĩnh vực đều đã bước vào giai đoạn chững lại plateau. Những mảng mới bắt đầu gần đây như toán thi đấu có thể còn ít rõ hơn, nhưng nhìn theo mẫu biểu đồ trong quá khứ thì cuối cùng cũng rất có thể sẽ chững lại tương tự
Tôi vẫn chưa thật sự hiểu cách diễn đạt State of AI in 2026
Bài này có vẻ là bài đăng trùng lặp. Bản gốc là chuỗi thảo luận này, nguồn là 2026 AI Index Report của Stanford HAI