"Phần mềm trong thời đại AI" - Video bài giảng của Andrej Karpathy tại YC AI School

(youtube.com)

29 điểm bởi GN⁺ 2025-06-19 | 2 bình luận | Chia sẻ qua WhatsApp

"Software is Changing (Again)"
Mô hình phần mềm đang thay đổi về bản chất sau 70 năm, và trong vài năm gần đây đã tiến hóa rất nhanh thành Software 1.0 (mã truyền thống), 2.0 (trọng số mạng nơ-ron), 3.0 (LLM và prompt ngôn ngữ tự nhiên)
LLM không chỉ là công cụ đơn thuần mà đang trở thành một hệ sinh thái phần mềm mới tương tự hệ điều hành (Operating System), mở ra thời đại mà ai cũng có thể lập trình máy tính bằng ngôn ngữ tự nhiên như tiếng Anh
Hợp tác với công cụ/agent AI và 'tự chủ một phần (Partial Autonomy)' sẽ trở thành cốt lõi của sản phẩm phần mềm tương lai, và để đáng tin cậy thì phải đi kèm việc con người kiểm chứng và kiểm soát nhanh chóng
AI và LLM mang đặc tính của 'những linh hồn giống con người (people spirits)', có trí nhớ và tri thức rất lớn nhưng đồng thời cũng chứa những giới hạn riêng như hallucination, mất ngữ cảnh, rủi ro bảo mật
Trong tương lai, phần mềm, tài liệu và hạ tầng sẽ phải được thiết kế lại theo hướng 'thân thiện với agent (LLM-friendly)', với cấu trúc và cách biểu đạt thay đổi để LLM có thể dễ dàng hiểu và hành động

Software 1.0 → 2.0 → 3.0: Sự tiến hóa của mô hình

Software 1.0: mã nguồn truyền thống do con người trực tiếp viết
Software 2.0: mô hình được tạo bằng cách tinh chỉnh trọng số (tham số) của mạng nơ-ron với dataset và optimizer
Software 3.0: dựa trên mô hình ngôn ngữ lớn (LLM), tạo chương trình (lệnh) bằng prompt ngôn ngữ tự nhiên như tiếng Anh

Gần đây trên GitHub, code đang tiến hóa theo dạng pha trộn giữa tiếng Anh và mã, và tiếng Anh như một ngôn ngữ lập trình đang lan rộng rất nhanh
Hugging Face đang đóng vai trò như 'GitHub' của Software 2.0, dẫn dắt hệ sinh thái mô hình mã nguồn mở

LLM là một hệ điều hành (OS) mới

LLM đang tiến hóa vượt ra ngoài API/utility đơn thuần để trở thành một nền tảng nơi nhiều phần mềm khác nhau vận hành như trên hệ điều hành
Hiện tại, việc khai thác LLM đang diễn ra trong cấu trúc tập trung xoay quanh đám mây, tương tự thời đại mainframe những năm 1960
Về dài hạn, khả năng thời đại LLM cá nhân (khai thác phân tán/cục bộ) sẽ xuất hiện cũng được nhắc tới
Môi trường sử dụng LLM tương tự terminal/giao diện dòng lệnh truyền thống, nhưng GUI phổ dụng vẫn chưa phát triển đầy đủ

Năng lực và giới hạn của LLM

LLM có trí nhớ khổng lồ và năng lực tiếp thu tri thức, nhưng cũng tồn tại những lỗi cố hữu như hallucination (thông tin sai lệch), mất ghi nhớ ngữ cảnh, lỗ hổng bảo mật
'Ngữ cảnh làm việc (working memory)' của LLM vẫn cần con người quản lý một cách rõ ràng, và khả năng học ngữ cảnh dài hạn vẫn còn hạn chế
Vì có những rủi ro thực tế như bảo mật và prompt injection, nên cần thận trọng khi sử dụng

Tự chủ một phần (Partial Autonomy) và hợp tác giữa con người với LLM

Các ứng dụng dựa trên LLM như Cursor, Perplexity đang tiến hóa theo hướng kết hợp giữa thao tác thủ công truyền thống và tự động hóa bằng LLM, với khái niệm 'thanh trượt mức tự chủ' (điều chỉnh mức độ kiểm soát của người dùng/ủy quyền cho AI)
Audit qua GUI và vòng lặp kiểm chứng nhanh, cùng với 'phương pháp ràng buộc AI trong phạm vi ngắn để kiểm soát', là điều thiết yếu trong thực tế công việc
Dự đoán rằng phần mềm, sản phẩm và dịch vụ đều sẽ dần tăng cường mức độ 'tự động hóa một phần'

Các ví dụ thực tế và văn hóa 'Vibecoding'

Văn hóa 'Vibecoding', nơi bất kỳ ai cũng trực tiếp tạo ứng dụng bằng LLM thông qua tiếng Anh, đang lan rộng
Karpathy cũng chia sẻ trải nghiệm tự tạo một ứng dụng iOS chỉ trong một ngày bằng một ngôn ngữ không có kinh nghiệm lập trình trước đó (Swift), rồi mở rộng nó thành dịch vụ thực tế
LLM giúp việc phát triển prototype thực tế trở nên dễ dàng, nhưng đưa thành dịch vụ thật (xác thực, thanh toán, triển khai...) vẫn là điểm nghẽn do thao tác thủ công và DevOps
Trong tương lai, bài toán cốt lõi sẽ là thiết kế 'phần mềm/tài liệu thân thiện với agent' để 'agent' có thể thay con người thực hiện những phần vẫn phải tự tay click/cấu hình

Sự thay đổi của tài liệu/hạ tầng và tính thân thiện với agent

Tài liệu hiện tại vốn hướng đến con người (click, thứ tự thao tác...) khó để LLM/agent sử dụng ngay, nên cần được tái cấu trúc theo hướng Markdown và lệnh command
Versell, Stripe đang bắt đầu chuyển đổi tài liệu theo hướng thân thiện với agent (ví dụ: lệnh curl)
Nhiều công cụ như GitHub Ingest, DeepWiki giúp chuyển kho mã nguồn/tài liệu sang dạng mà LLM có thể sử dụng ngay

Kết luận và triển vọng

Hiện nay là thời điểm tốt nhất để viết mới và viết lại một lượng lớn code
LLM sẽ hợp tác với nhà phát triển con người như một 'công cụ hỗ trợ (bộ giáp Iron Man)', và đổi mới theo hướng tiến dần đến tự chủ hoàn toàn sẽ tiếp tục diễn ra
Trong 10 năm tới, quá trình từng bước nâng 'thanh trượt mức tự chủ' được dự báo sẽ là xu hướng then chốt
Nhà phát triển và tổ chức cần khẩn trương thiết kế lại phần mềm, tài liệu và hạ tầng để tối ưu cho LLM/agent

2 bình luận

laeyoung 2025-06-24

Video này cực kỳ hay! Khi nhắc đến câu nói của Andrew Ng rằng "AI Is the New Electricity", anh ấy nói rằng nếu ChatGPT với 800 triệu người dùng bị sập thì cũng chẳng khác nào mất điện, và điều đó thực sự khiến tôi thấy rất thấm.

GN⁺ 2025-06-19

Ý kiến trên Hacker News

Chia sẻ cảm nhận rằng rất thích cách ví von của Karpathy và góc nhìn nhìn thẳng, chính xác vào thực tế
Nêu ý kiến rằng việc so sánh song song giữa lập trình truyền thống, trọng số mạng nơ-ron và prompt là rất thú vị; ví dụ, trong mô-đun lái xe tự động, thay vì dùng mã do con người trực tiếp viết, việc tối ưu hóa mạng nơ-ron theo một tập dữ liệu đại diện tốt cho đối tượng thực tế khá hữu ích. Tuy vậy, cũng nhấn mạnh rằng trong nhiều môi trường, do các ràng buộc phần cứng, phạm vi ứng dụng mà "software 2.0" hay "software 3.0" có thể mang lại sẽ rất hạn chế. Mã nguồn truyền thống và prompt sẽ tiếp tục là những công cụ bổ trợ cho nhau, chứ không bên nào là lời giải hoàn hảo
Khen Karpathy luôn là người có tư duy rất rõ ràng và cho rằng các phép ví von của anh ấy rất ấn tượng; sau khi thấy Waymo đã có thể lái xe tự động không gián đoạn từ năm 2013, người viết tò mò không biết lý do họ không thể mở rộng nhanh hơn là vì quy định pháp lý hay vì bài toán tối ưu hóa việc lái xe vốn rất khó. Cũng nhắc rằng một slide có ghi “AGI 2027” và đề cập ai-2027.com
Chia sẻ ngắn rằng khá bất ngờ vì bài trình bày được công bố sớm hơn dự kiến rất nhiều
Cảm ơn YC đã chia sẻ trước khi bài nói chuyện trở nên lỗi thời, đồng thời cung cấp liên kết tweet liên quan (https://x.com/karpathy/status/1935077692258558443)