- Video giải thích chuyên sâu về công nghệ AI mô hình ngôn ngữ lớn (LLM) vận hành ChatGPT và các sản phẩm liên quan dành cho người dùng phổ thông (3 giờ 31 phút)
- Trình bày toàn bộ ngăn xếp huấn luyện về cách mô hình được phát triển, cùng với cách suy nghĩ về 'tâm lý' của mô hình và mô hình tư duy để tận dụng tối đa mô hình trong các ứng dụng thực tế
- Phiên bản toàn diện hơn một chút so với video "Intro to LLMs" được công bố cách đây 1 năm
Các chương
00:00:00 introduction
00:01:00 pretraining data (internet)
00:07:47 tokenization
00:14:27 neural network I/O
00:20:11 neural network internals
00:26:01 inference
00:31:09 GPT-2: training and inference
00:42:52 Llama 3.1 base model inference
00:59:23 pretraining to post-training
01:01:06 post-training data (conversations)
01:20:32 hallucinations, tool use, knowledge/working memory
01:41:46 knowledge of self
01:46:56 models need tokens to think
02:01:11 tokenization revisited: models struggle with spelling
02:04:53 jagged intelligence
02:07:28 supervised finetuning to reinforcement learning
02:14:42 reinforcement learning
02:27:47 DeepSeek-R1
02:42:07 AlphaGo
02:48:26 reinforcement learning from human feedback (RLHF)
03:09:39 preview of things to come
03:15:15 keeping track of LLMs
03:18:34 where to find LLMs
03:21:46 grand summary
2 bình luận
Nhược điểm (?) của video của Andrej Karpathy có lẽ là hoàn toàn không thể xem ở tốc độ 1.5x. Anh ấy nói thật sự rất nhanh. :-)
Ý kiến trên Hacker News
Tôi rất kính trọng người này. Anh ấy giống như Neo, người lấp đầy khoảng cách giữa con người và máy móc. Những thứ tôi đã học miễn phí từ kho lưu trữ và video của anh ấy:
Tôi nói với bạn bè rằng Andrej là giảng viên giỏi nhất mà tôi từng gặp ở bậc cao học. Tôi không học Stanford, nhưng tôi đã xem video CS321n của anh ấy trên YouTube. Tôi rất vui vì anh ấy vẫn tiếp tục làm video
Anh ấy đã làm hơn 5 video về cơ bản xoay quanh cùng một chủ đề: kiến trúc transformer và quá trình huấn luyện. Tôi tò mò lần này có gì khác
Tôi thực sự thích series "let's build" của anh ấy. Ngoài nội dung nâng cao, tôi còn học được nhiều mẹo Python rất hay
Tôi thấy frustrate vì mình không thể tập trung vào video dài. Có lẽ những video này tốt hơn nhiều so với video ngắn
Tôi vẫn nhớ cách backpropagation bằng Python list như một phần của dự án CS231n. Điều đáng kinh ngạc là tôi thậm chí không học Stanford
Cảm ơn Andrej. Tôi có hiểu biết khá tốt về cách LLM hoạt động và được huấn luyện, nhưng nhiều bạn bè của tôi thì không. Video và bài giảng này giúp họ có được một ý niệm nào đó
Tôi ước có cách khác để phân phối video. Nội dung trên YouTube cuối cùng rồi cũng biến mất. Tôi nghĩ nội dung này rất quan trọng. Càng nhiều người hiểu AI hoạt động như thế nào thì xã hội sẽ càng vững mạnh hơn
Tôi đã xem hết toàn bộ... má tôi đã ngủ quên mất nhưng hoàn toàn xứng đáng. Cảm ơn Andrej
Tôi là một người đơn giản. Hễ thấy video của Karpathy là tôi bấm vào, xem và tận hưởng