Những biểu đồ giải thích hiện trạng AI năm 2026

(spectrum.ieee.org)

3 điểm bởi GN⁺ 2026-04-20 | 1 bình luận | Chia sẻ qua WhatsApp

AI Index 2026 là báo cáo tổng hợp xu hướng chung của AI qua các chỉ số như hiệu năng benchmark, đầu tư, nhận thức của công chúng, năng lực compute và phát thải carbon
Việc ra mắt các mô hình AI đáng chú ý tiếp tục tập trung ở Mỹ và khối công nghiệp, trong khi Trung Quốc ghi nhận ưu thế rõ rệt về lắp đặt robot công nghiệp
Năng lực compute AI toàn cầu đã tăng hơn 3 lần mỗi năm kể từ 2022, và GPU Nvidia hiện chiếm hơn 60 phần trăm tổng năng lực
Hiệu năng benchmark của LLM đa phương thức và agentic AI tăng nhanh, nhưng ở các tác vụ phổ thông như đọc đồng hồ kim thì độ chính xác vẫn thấp
Đầu tư AI trong năm 2025 vượt 581 tỷ USD, lập mức cao nhất từ trước đến nay; tác động đến việc làm, niềm tin vào quy định và mức độ chấp nhận của công chúng khác biệt lớn tùy quốc gia và chỉ số

Các chỉ số chính của báo cáo AI Index 2026

Báo cáo AI Index 2026 dài hơn 400 trang của Stanford tổng hợp hiện trạng AI từ nhiều góc độ như điểm benchmark, đầu tư và nhận thức của công chúng
Hiệu năng mô hình AI dẫn đầu tiếp tục tăng tốc, và các công ty AI lớn như OpenAI và Anthropic đang hướng tới IPO trong nửa cuối năm nay
Tâm lý phản cảm với AI cũng vẫn tiếp diễn; đặc biệt tại Mỹ, chính quyền địa phương bắt đầu chấp nhận các biện pháp hạn chế hoặc cấm hoàn toàn việc phát triển các trung tâm dữ liệu mới
Tiếp nối các bài tổng hợp xu hướng của những năm trước từ 2021 đến 2025, đây là phần chọn lọc các xu hướng cô đọng hiện trạng AI năm 2026

Ưu thế về mô hình AI của Mỹ

Mỹ đã dẫn dắt việc phát hành các mô hình AI đáng chú ý trong suốt 10 năm qua, và xu hướng đó vẫn tiếp tục trong năm 2025
- Theo Epoch AI, số mô hình đáng chú ý do các tổ chức tại Mỹ phát hành trong năm 2025 là 50 mô hình
- Sản lượng của Trung Quốc bắt đầu thu hẹp khoảng cách
Gần như toàn bộ các mô hình đáng chú ý đều đến từ khối công nghiệp
- Trong năm 2025, số lần phát hành mô hình đáng chú ý của khối công nghiệp là 87
- Tổng số phát hành từ các nguồn khác, gồm học thuật và cơ quan chính phủ, là 7
Tỷ trọng của khối công nghiệp đã mở rộng mạnh trong dài hạn
- Các mô hình do khối công nghiệp phát hành hiện chiếm hơn 90 phần trăm số mô hình đáng chú ý
- Năm 2015 là dưới 50 phần trăm, còn năm 2003 là 0

Ưu thế của Trung Quốc trong triển khai robot

Doanh nghiệp Mỹ dẫn trước về số lượng mô hình AI đáng chú ý, nhưng Trung Quốc có ưu thế vượt trội ở triển khai robot
- Theo dữ liệu của International Federation of Robotics, số robot công nghiệp được lắp đặt tại Trung Quốc trong năm 2024 là 295.000 chiếc
- Nhật Bản lắp khoảng 44.500 chiếc, còn Mỹ là 34.200 chiếc

Compute AI toàn cầu tăng vọt

Chỉ số tổng năng lực compute AI của Epoch AI được đưa ra như thước đo đại diện cho sự mở rộng của hạ tầng AI
Trên biểu đồ lấy hiệu năng H100e của Nvidia làm mốc chuẩn, năng lực compute AI toàn cầu đã tăng hơn 3 lần mỗi năm kể từ 2022
- Nếu lấy 2021 làm năm bắt đầu theo dõi, tổng compute AI đã tăng 30 lần
Quảng cáo
Nvidia là bên hưởng lợi lớn nhất từ đợt mở rộng này
- GPU Nvidia hiện chiếm hơn 60 phần trăm tổng năng lực compute AI toàn cầu
- Amazon và Google, hai công ty tự thiết kế phần cứng AI, đứng sau đó

Phát thải carbon từ huấn luyện và suy luận AI

Lượng phát thải carbon trong quá trình huấn luyện AI đã là vấn đề được chỉ ra từ những năm trước, và sang 2026 mối lo này vẫn tiếp diễn
Việc huấn luyện các mô hình ngôn ngữ lớn frontier mới nhất được ước tính tạo ra lượng phát thải rất lớn
- Mức phát thải ước tính của quá trình huấn luyện Grok 4 của xAI vượt 72.000 tấn quy đổi carbon
- OpenAI GPT-4 được ước tính ở mức 5.184 tấn, còn Meta Llama 3.1 405B là 8.930 tấn
Ray Perrault cho biết các con số này chỉ là ước tính và cần thận trọng khi diễn giải
- “These estimates should be interpreted with caution”
- Với Grok, có độ bất định lớn vì các đầu vào phần nhiều được suy ra từ bài viết của Forbes, phát biểu của xAI và các nguồn khác không thể kiểm chứng
- Epoch AI còn ước tính độc lập lượng phát thải của Grok 4 cao hơn, ở khoảng 140.000 tấn CO₂
Phát thải từ suy luận AI cũng đang tăng và khác biệt giữa các mô hình là rất lớn
- Mô hình suy luận kém hiệu quả nhất có lượng phát thải cao gấp hơn 10 lần mô hình hiệu quả nhất
- DeepSeek V3 được ước tính tiêu thụ khoảng 23 watt khi trả lời prompt có độ dài trung bình
- Claude 4 Opus được ước tính tiêu thụ khoảng 5 watt

Hiệu năng benchmark của LLM tăng tốc

Trong 10 năm qua, hiệu năng mô hình AI đã cải thiện rất nhanh, và trên biểu đồ tốc độ tiến bộ này còn đang tăng thêm
Đặc biệt, LLM đa phương thức tiến bộ đến mức gần như chinh phục ngay lập tức các benchmark mới được tạo ra
Mức tăng mạnh nhất nằm ở mảng agentic AI
- Hai đường tăng dốc ở phía bên phải biểu đồ là benchmark OSWorld, dùng để đánh giá khả năng sử dụng máy tính tự động
- Và benchmark kỹ nghệ phần mềm SWE-Bench Verified, dùng để đánh giá khả năng lập trình tự động
Hiệu năng trên Humanity’s Last Exam cũng tăng nhanh
- Trong Stanford AI Index 2025, mô hình đứng đầu là OpenAI o1 với tỷ lệ trả lời đúng 8,8 phần trăm
- Sau đó, độ chính xác đã tăng lên tới 38,3 phần trăm
- Tính đến tháng 4/2026, các mô hình đạt điểm cao nhất như Anthropic Claude Opus 4.6 và Google Gemini 3.1 Pro đều vượt 50 phần trăm
Quảng cáo
Ray Perrault cũng lưu ý về mối tương ứng giữa benchmark và hiệu năng thực tế
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- Ông nhắc rằng chỉ riêng mức chính xác 75 phần trăm trên benchmark suy luận pháp lý là chưa đủ để biết liệu nó có phù hợp với công việc thực tế của một hãng luật hay không

Mở rộng nghiên cứu AI trong y tế

Việc áp dụng AI trong nghiên cứu y tế đang tăng nhanh
Số lượng bài báo về khám phá thuốc dựa trên AI đã tăng hơn gấp đôi trong 2 năm qua
Số bài báo về AI y sinh đa phương thức, kết hợp xử lý hình ảnh y khoa và văn bản, đã tăng 2,7 lần so với 2 năm trước

Giới hạn trong việc đọc đồng hồ kim

Trái với sự cải thiện nhanh ở một số lĩnh vực, các điểm yếu vẫn tồn tại ở các tác vụ phổ thông như đọc đồng hồ kim và hiểu lịch
Trên ClockBench, benchmark đo khả năng đọc đồng hồ kim của LLM đa phương thức, ngay cả mô hình tốt nhất cũng chỉ có xác suất thành công khoảng một nửa
- OpenAI GPT-5.4 có xác suất trả lời đúng là 50-50
Phần lớn mô hình có kết quả thấp hơn nhiều
- Anthropic Claude Opus 4.6 chỉ đạt độ chính xác 8,9 phần trăm
- Cùng mô hình này lại được nhắc đến là đạt điểm hàng đầu trên Humanity’s Last Exam
Ray Perrault liên hệ điều này với một vấn đề tổng quát hơn
- Khi đặt câu hỏi đòi hỏi kết hợp ngôn ngữ với các modality khác như hình ảnh hay ngữ điệu giọng nói, thành phần ngôn ngữ lại chiếm tỷ trọng lớn hơn dự kiến
- Ông cũng nhắc tới các hướng nghiên cứu cho thấy hệ thống có thể đi tới mức gần như bỏ qua hoàn toàn thông tin phi ngôn ngữ

Đầu tư AI lập đỉnh trong năm 2025

Cùng với việc hiệu năng mô hình AI tăng lên, đầu tư AI cũng tăng theo
Theo dữ liệu của công ty phân tích AI Quid, đầu tư AI trong năm 2025 đạt mức kỷ lục hơn 581 tỷ USD
- Cao hơn gấp đôi mức 253 tỷ USD của năm 2024
- Đồng thời vượt xa mức đỉnh trước đó là 360 tỷ USD vào năm 2021
Khác với năm 2021, kỷ lục năm 2025 không do M&A mà chủ yếu do đầu tư tư nhân vào các công ty AI dẫn dắt
Phần lớn vốn đầu tư chảy vào Mỹ
- Trong năm qua, tổng đầu tư AI tại Mỹ vượt 344 tỷ USD
Quảng cáo

Kỹ sư phần mềm tập trung vào AI

Trên GitHub, số lượng dự án liên quan đến AI đã tăng vọt lên 5,58 triệu vào năm 2025
- Cao gấp khoảng 5 lần so với năm 2020
- Tăng 23,7 phần trăm so với năm 2024
Mức tăng này dường như không chỉ là do làn sóng dự án do AI tạo ra
- Số dự án có từ 10 sao trở lên cũng tăng với tốc độ tương tự
- Tổng số sao mà các dự án AI nhận được cũng tăng với tốc độ tương tự
- Điều đó cho thấy vẫn có sự tham gia của con người
Một ví dụ tiêu biểu là phần mềm agentic AI mã nguồn mở OpenClaw
- Dự án này đạt 352.000 stars trên GitHub
Ray Perrault thừa nhận rằng các dự án bot hay agent AI có thể góp phần tạo nên sức nóng này
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Ông cũng nhắc rằng theo trang theo dõi hoạt động Agents in the Wild, vốn không được đề cập trong báo cáo của Stanford, phần lớn hoạt động trên GitHub có vẻ vẫn do con người thực hiện
Các bài báo khoa học máy tính cũng cho thấy sức nóng của AI
- Số bài báo khoa học máy tính liên quan đến AI đã tăng hơn gấp đôi trong 10 năm qua, từ 102.000 lên 258.000
- Tính đến năm 2024, hơn 68 phần trăm trong số này đến từ giới học thuật
- Tỷ trọng của chính phủ và khối công nghiệp lần lượt vào khoảng 11,5 phần trăm và 12,5 phần trăm
- Tăng trưởng được dẫn dắt bởi các lĩnh vực machine learning, computer vision và generative AI

Tác động của AI đến việc làm vẫn chưa rõ ràng

Cùng với sự lan rộng của AI tạo sinh, lo ngại về việc làm gia tăng, nhưng dữ liệu hiện tại cho ra kết quả pha trộn
Báo cáo đưa ra biểu đồ số nhân sự chuẩn hóa theo độ tuổi của các nhóm nghề được xem là có rủi ro cao bị AI thay thế như software developers và customer support agents
- Việc làm cho người mới vào nghề giảm
- Vị trí trung cấp và senior được duy trì hoặc tăng lên
Quảng cáo
Rất khó diễn giải các thay đổi này nếu tách khỏi các xu hướng kinh tế rộng hơn
- Báo cáo cho biết tỷ lệ thất nghiệp tăng trên nhiều nhóm nghề
- Trái với dự đoán, mức tăng thất nghiệp của nhóm lao động có mức tiếp xúc với AI thấp nhất lại lớn hơn nhóm có mức tiếp xúc với AI cao nhất

Thay đổi trong nhận thức của công chúng về AI

Trong khảo sát của Ipsos, sự lạc quan về AI đã tăng nhẹ nhưng đáng chú ý trong vài năm gần đây
- Tỷ lệ trả lời “benefits outweigh the drawbacks” tăng từ 55 phần trăm năm 2024 lên 59 phần trăm
- Tỷ lệ cho rằng mình “good understanding” về AI tăng nhẹ từ 67 phần trăm lên 68 phần trăm
Ở các câu hỏi tương tự, mức chấp nhận tổng thể vẫn nghiêng về tích cực hơn tiêu cực, nhưng một số cảm xúc tiêu cực cũng tăng
- 52 phần trăm người trả lời cho biết các sản phẩm và dịch vụ dùng AI khiến họ cảm thấy “nervous”
Chênh lệch giữa các quốc gia là rất lớn
- Trung Quốc cùng các nước Đông Nam Á như Malaysia, Thailand, Indonesia và Singapore có xu hướng tích cực hơn
- Mức chuyển biến tích cực lớn nhất theo năm thuộc về Germany 12 phần trăm, France 10 phần trăm và the Netherlands 10 phần trăm
- Colombia ghi nhận mức chuyển biến tiêu cực mạnh nhất với -6 phần trăm

Khác biệt theo quốc gia về niềm tin vào quản lý AI

Cùng với nhận thức ngày càng tăng rằng AI có thể tạo tác động tích cực, ở một số quốc gia cũng tồn tại sự mất lòng tin sâu sắc vào năng lực quản lý của chính phủ
Mỹ là trường hợp tiêu biểu: dù dẫn đầu về đầu tư AI, mức tin tưởng vào quản lý lại nằm trong nhóm thấp nhất
- Trong khảo sát của Ipsos, chỉ 31 phần trăm người trả lời tại Mỹ nói rằng họ tin tưởng chính phủ có thể quản lý AI
Nhiều nước châu Âu và Nhật Bản cũng có mức tin tưởng thấp
Các quốc gia ở châu Á và Nam Mỹ lại có mức tin tưởng cao nhất vào năng lực quản lý AI của chính phủ
Sự đối lập giữa Mỹ và Colombia đặc biệt nổi bật
- Tại Mỹ, có sự mất lòng tin sâu sắc vào quản lý AI, nhưng đa số người trả lời vẫn cho rằng lợi ích của AI lớn hơn bất lợi
- Tại Colombia, niềm tin vào quản lý AI cao nhưng cảm nhận chung về AI lại xấu đi
Như một phiên bản thu nhỏ của câu chuyện AI năm 2025, chất lượng hiệu năng mô hình và nhận thức về tác động xã hội thay đổi rất mạnh tùy theo từng tác vụ và từng câu hỏi

1 bình luận

GN⁺ 2026-04-20

Ý kiến trên Hacker News

Tôi muốn chỉ ra rằng nhận thức của giới trẻ về AI không hẳn là sáng sủa như nhiều người nghĩ. Nếu nhìn vào khảo sát của Gallup, có thể thấy sự hoài nghi là khá rõ ràng
- Tôi xem đây là quá trình con người dần nhận ra những giới hạn bản chất của AI
- Tôi cho rằng bầu không khí này chỉ là tạm thời. Cũng như mọi lần chuyển đổi công nghệ mới trong lịch sử, cuối cùng mọi người sẽ thích nghi và tìm ra cách ứng dụng nó
Dù việc huấn luyện một frontier LLM mới nhất có tạo ra hơn 72 nghìn tấn khí thải carbon, tôi vẫn nghĩ đó là tương đối nhỏ nếu so với quy mô 38 tỷ tấn mỗi năm trên toàn cầu
- Tôi không nghĩ việc lượng phát thải khi huấn luyện một LLM tương đương phát thải hằng năm của 17 nghìn người là chuyện nhỏ chút nào. Theo bài viết, con số này đã tăng gấp 8 lần so với năm ngoái và còn có khả năng bị ước tính thấp khoảng 2 lần. Hơn nữa, còn chưa tính phần cứng, bot thu thập dữ liệu huấn luyện, xử lý prompt và toàn bộ phần sử dụng nói chung; trong khi có nhiều mô hình lớn như vậy và hàng chục nghìn mô hình nhỏ. Ước tính tổng phát thải AI năm nay vượt 80 triệu tấn CO2e, lớn hơn cả tổng của những quốc gia như Austria hay Israel, nên hoàn toàn không thể xem nhẹ
- Tôi nghĩ cũng có thể nhìn theo cách này. Nếu huấn luyện một mô hình tốn 72 nghìn tấn và mô hình đó được 100 triệu người dùng, thì bình quân mỗi người chỉ ở mức 0,00072 tấn. Theo bài viết, phát thải trung bình hằng năm của một người là hơn 5 tấn, còn người Mỹ khoảng 18 tấn, nên cộng thêm 0,00072 vào thì gần như không cảm nhận được gì. Tất nhiên, chi phí suy luận là chuyện khác
- Tôi cho rằng con số này thực tế là không đáng kể, ngay cả khi tính đến việc xAI dường như cố tình làm tăng cường độ carbon. Hơn nữa, việc chọn hai mô hình tiêu biểu của năm 2025 mà cả hai đều là Grok thì khá buồn cười, vì chẳng khác nào lấy một trong những mô hình kém hữu dụng, ít được dùng và ít thú vị nhất của năm đó ra làm đại diện
Rốt cuộc tôi cho rằng sẽ không ai thật sự có hào lũy moat, nên biểu đồ này chỉ càng cho thấy sự ngộ nhận của nhà đầu tư
- Tôi nghĩ hào lũy chắc chắn sẽ hình thành. Có thể dồn ngân sách vào chất lượng token, hoặc dùng ít token hơn nhưng tốt hơn. Khi kết hợp với tệp người dùng và mức độ gắn kết, sẽ tạo ra một flywheel khiến người mới rất khó đuổi kịp. Thị trường vốn phức tạp, nên nếu đơn giản hóa thì sẽ bỏ sót rất nhiều thứ
- Tôi cho rằng vốn và momentum tự thân cũng là hào lũy. Đúng là các mô hình Trung Quốc có dùng chưng cất, nhưng hiện tại vẫn chưa thấy nhiều trường hợp huấn luyện mô hình quy mô lớn ngay từ đầu. Dù vậy, nếu chip rẻ hơn và chip Trung Quốc được triển khai mạnh, tình hình có thể thay đổi
Dù mảng robotics dẫn đầu của China cũng đáng chú ý, nhưng điều đầu tiên đập vào mắt tôi lại là biểu đồ phát thải của Grok
- Khi nhìn câu trong bài rằng "ước tính này cần được diễn giải thận trọng, và riêng với Grok thì phụ thuộc rất nhiều vào các đầu vào được suy luận từ các báo cáo công khai", tôi thấy biểu đồ đó khá đáng ngờ về mặt độ tin cậy
Chỉ vì số dự án GitHub được tạo ra tăng mà nói rằng "các kỹ sư phần mềm đã all-in vào AI" thì nghe khá buồn cười. Tạo một repository đâu có khiến ai đó trở thành kỹ sư phần mềm, nếu vậy thì có khi chẳng cần học gì khác nữa
- Tôi đồng ý rằng đó không phải chỉ số tốt, và thay vào đó nên dùng các chỉ số như Claude Code GitHub Commits Over Time. Tất nhiên cái này cũng không hoàn hảo, nhưng ít nhất nó là một chỉ số bớt khiếm khuyết hơn đôi chút và cho cảm giác thể hiện được những xu hướng có ý nghĩa tốt hơn
Phần "China đang dẫn đầu về robotics" có vẻ chẳng liên quan nhiều đến AI. Biểu đồ của China gần như đi theo cùng một quỹ đạo từ năm 2012, nên tôi cảm thấy biểu đồ đó không thật sự khớp với ngữ cảnh bài viết
- Tôi nghĩ dù khi đó chưa có ChatGPT, thì chính các kỹ thuật ML vận hành robotics vẫn đã hoạt động đủ tốt từ thời điểm ấy rồi
Câu "việc huấn luyện mô hình AI có thể thải ra lượng carbon rất lớn" là đúng, nhưng thứ tôi thật sự muốn xem là biểu đồ về lượng carbon phát sinh khi vận hành dịch vụ các mô hình này trên quy mô toàn cầu
Tôi khó đồng ý với câu "trong 10 năm qua, hiệu năng mô hình AI đã cải thiện với tốc độ đáng kinh ngạc, và tiến bộ đó còn đang tăng tốc". Theo tôi, gần như mọi lĩnh vực đều đã bước vào giai đoạn chững lại plateau. Những mảng mới bắt đầu gần đây như toán thi đấu có thể còn ít rõ hơn, nhưng nhìn theo mẫu biểu đồ trong quá khứ thì cuối cùng cũng rất có thể sẽ chững lại tương tự
Tôi vẫn chưa thật sự hiểu cách diễn đạt State of AI in 2026
Bài này có vẻ là bài đăng trùng lặp. Bản gốc là chuỗi thảo luận này, nguồn là 2026 AI Index Report của Stanford HAI

Những biểu đồ giải thích hiện trạng AI năm 2026

Các chỉ số chính của báo cáo AI Index 2026

Ưu thế về mô hình AI của Mỹ

Ưu thế của Trung Quốc trong triển khai robot

Compute AI toàn cầu tăng vọt

Phát thải carbon từ huấn luyện và suy luận AI

Hiệu năng benchmark của LLM tăng tốc

Mở rộng nghiên cứu AI trong y tế

Giới hạn trong việc đọc đồng hồ kim

Đầu tư AI lập đỉnh trong năm 2025

Kỹ sư phần mềm tập trung vào AI

Tác động của AI đến việc làm vẫn chưa rõ ràng

Thay đổi trong nhận thức của công chúng về AI

Khác biệt theo quốc gia về niềm tin vào quản lý AI

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News