Cách riêng của tôi để theo kịp sự phát triển của AI (và vì sao bạn cũng nhất định nên làm vậy)
(blog.nilenso.com)- AI tạo sinh là công nghệ phát triển nhanh nhất hiện nay, và cả đánh giá thấp lẫn đánh giá quá cao đều nguy hiểm
- Theo dõi đều đặn các nguồn uy tín và chuyên gia đáng tin cậy là điều bắt buộc
- Khuyến nghị một pipeline thông tin cân bằng như Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
- Thông báo chính thức từ các phòng thí nghiệm AI, blog kỹ thuật, bài báo học thuật là thiết yếu để nắm bắt tiến bộ thực tế và các giới hạn của công nghệ
- Có thể tiếp cận cả xu hướng mới nhất lẫn phân tích chuyên sâu qua nhiều kênh như Twitter/X, bản tin tuyển chọn tin tức, danh sách chuyên gia
Mở đầu: Hiểu lầm về AI và ô nhiễm thông tin
- AI tạo sinh là công nghệ phát triển nhanh nhất trong cuộc đời của tác giả
- Nhưng những hiểu lầm về AI cũng lan tràn, và bản thân môi trường thông tin hiện nay rất hỗn loạn
- Thực tế đã có những trường hợp doanh nghiệp, chính phủ hoặc cá nhân không hiểu đủ về công nghệ liên quan, dẫn đến lạm dụng hoặc gây ra thiệt hại nghiêm trọng
- Tồn tại hai cực hiểu sai: hoặc đánh giá thấp AI (“một trào lưu sớm tàn”), hoặc đánh giá quá cao (“lập trình viên không còn cần thiết nữa”)
- Sự thiếu hiểu biết đúng đắn về công nghệ là gốc rễ của những ngộ nhận này
Cách tiếp cận để tiếp nhận thông tin về AI
- Hiểu đúng thông tin liên quan đến AI không hề dễ như nhiều người nghĩ
- Đây là môi trường mà thông tin méo mó, phóng đại hoặc các diễn ngôn bị kìm nén xuất hiện hằng ngày
- Nếu không chủ động và có hệ thống trong việc sàng lọc thông tin, bạn sẽ dễ phơi nhiễm trước sai sót, cường điệu và bóp méo
- Tác giả cho biết mình được hỗ trợ rất nhiều nhờ xây dựng một pipeline thông tin cân bằng, và khuyến nghị đây là điểm khởi đầu tốt cho người mới
Những nguyên tắc chung khi tiếp nhận thông tin
- Điều quan trọng là tham khảo thông tin càng gần nguồn gốc càng tốt
- Cần kiểm tra các thông báo chính thức từ các phòng thí nghiệm AI hoặc ý kiến của những nhân vật chủ chốt như nguồn sơ cấp
- Cần giữ thái độ không quá tin vào các bài tường thuật cấp 2, cấp 3
- Cũng cần chủ động tìm và tham khảo bình luận từ các chuyên gia đáng tin cậy
Những điểm khởi đầu được khuyến nghị
-
Simon Willison’s Blog
- Simon Willison’s Blog (thẻ AI)
- Điểm khởi đầu được khuyến nghị nhất cho dân kỹ thuật, bao quát rộng từ frontier AI, ứng dụng, bảo mật đến các vấn đề đạo đức
- Ông cũng nổi tiếng là người sáng lập Django, Datasette
- Ví dụ: The Lethal Trifecta, LLMs in 2024
-
Andrej Karpathy
- Twitter/X | YouTube
- Thành viên sáng lập OpenAI và cựu giám đốc AI tại Tesla
- Đây là kênh dễ học nhất về cấu trúc bên trong và nguyên lý của mô hình AI, đồng thời cũng giúp quan sát ảnh hưởng văn hóa và những thay đổi xã hội do AI tạo ra
- Ví dụ: Deep Dive into LLMs like ChatGPT, How I Use LLMs
Every’s Chain of Thought
- Every’s Chain of Thought
- Dan Shipper (đồng sáng lập Every) là người viết, cung cấp trải nghiệm sử dụng AI trong thực chiến và trải nghiệm mô hình thực tế vượt ra ngoài benchmark
- Ví dụ: Vibe Check: Codex, Vibe Check: o3
Cách theo dõi tài liệu chính thức từ các phòng thí nghiệm AI
- OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) và các nguồn chính thức khác như blog, tin tức, model card, hướng dẫn kỹ thuật, bài báo học thuật nên được kiểm tra định kỳ
- Ví dụ: Thông báo chính thức về OpenAI o3, Claude 4 System Card
- Blog kỹ thuật: Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- Ví dụ bài báo: Bài báo DeepSeek R1, Bài báo Biology của Anthropic
- Các phòng thí nghiệm quy mô nhỏ: Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire cũng rất đáng tham khảo
Các chuyên gia AI và kỹ sư thực chiến đáng chú ý
- Thông tin từ những chuyên gia từng làm công cụ mã nguồn mở hoặc có kinh nghiệm thực tế về AI engineering thường hữu ích hơn hướng dẫn chính thức trong nhiều trường hợp
Những nhân vật và blog tiêu biểu được khuyến nghị
- Hamel Husain
- Shreya Shankar
- Jason Liu
- Eugene Yan
- What We’ve Learned From A Year of Building with LLMs
- Kho tư liệu về các ca ứng dụng LLM do những người có kinh nghiệm triển khai thực tế biên soạn
- Chip Huyen
- Omar Khattab (Twitter)
- Kwindla Hultman Kramer (Twitter)
- Han Chung Lee
- Jo Kristian Bergum
- David Crawshaw
- Alexander Doria / Pierre Carl-Langlais
- Nathan Lambert’s “Interconnects”
- Ethan Mollick
- AI Snake Oil – Arvind Narayanan & Sayash Kapoor
Tận dụng tin tức/truyền thông và cộng đồng AI
-
Twitter/X
- Danh sách Twitter/X
- Trung tâm của thảo luận thời gian thực và tiếp nhận thông tin về AI, nơi có thể nắm bắt đủ loại tin tức và tranh luận
- Hãy tiêu thụ feed Twitter như đọc báo trong 15~20 phút, và khi cần thì theo dõi thêm nhân vật hoặc nguồn mới
-
Shawn Wang(swyx) / smol.ai
- Twitter của swyx | AI News by smol.ai
- Bản tin Latent Space
- Cung cấp bản tóm tắt xu hướng AI hằng ngày như một nguồn thay thế cho Twitter
-
Dwarkesh Patel
Cộng đồng thảo luận/tài liệu chuyên sâu về AI
- LessWrong (AI Alignment), AI Alignment Forum: an toàn AI, governance, phân tích kỹ thuật, v.v.
- Có rất nhiều thảo luận khó và chuyên sâu mà các kênh chính thống như Twitter thường không đề cập kỹ
- Ví dụ: Claude plays Pokémon breakdown, The Waluigi Effect
- Gwern: các bài viết chuyên sâu mang tính bách khoa về AI, LLM, transformer
- Cung cấp lượng lớn bài viết về AI cùng những insight mang tính dự báo như scaling của LLM
- Ví dụ: The Scaling Hypothesis, You could have invented transformers tutorial
- Prompt Whisperers/Latent space explorers
Cách thực hành tiếp nhận thông tin
- Không cần theo dõi hoàn hảo mọi nguồn; cách thực tế là xem feed Twitter như đọc báo
- Khi gặp một bài viết thú vị, nên theo dõi tác giả đó và mở rộng việc đọc sang các công trình khác của họ
- Đây là cách khám phá thông tin tương tự như việc từng khám phá âm nhạc trong quá khứ
- Nếu tiếp cận nó như một cuộc khám phá trí tuệ, nó có thể trở thành niềm vui thay vì nghĩa vụ
Kết luận và danh sách khuyến nghị
- Thông qua danh sách Twitter/X được cung cấp, bạn có thể theo dõi cùng lúc các chuyên gia và người làm thực tế nêu trên
- Tác giả cũng dự định sớm bổ sung thêm danh sách ở định dạng RSS
5 bình luận
Ý kiến Hacker News
Nếu hiểu cơ bản về cách LLM hoạt động, thì tôi nghĩ không cần phải bám theo toàn bộ luồng nội dung liên tục từ PR, blogger, lãnh đạo ngành hay các "nhà tư tưởng" trên Internet
Ngược lại, nếu cứ chạy theo các bài phỏng vấn hay bài viết kiểu đó thì rất dễ bị cuốn vào những trào lưu kỳ quặc mà thực tế chẳng giúp ích gì
Thực tế, khác biệt giữa các mô hình trong vài năm qua chủ yếu chỉ là chênh lệch về mức độ, chứ không có khác biệt bản chất quá lớn; hiện nay phần lớn thay đổi diễn ra ở công cụ hoặc khâu tích hợp
Cần luôn nhớ rằng LLM rốt cuộc là "mô hình văn bản" và được sinh ra mà không có tri thức nền, như vậy sẽ dễ phân biệt nó hữu ích ở đâu và không phù hợp ở đâu
Cá nhân tôi cũng không đồng cảm lắm với nhận định rằng "AI là công nghệ phát triển nhanh nhất trong đời tôi"
Tôi đã trải qua thời SVM nổi lên, thời mạng nơ-ron bị xem như trò đùa, rồi thời deep learning và hàng loạt framework DL bùng nổ trong hơn 10 năm qua
Khi đó cũng đã có những bước phát triển cực kỳ chóng mặt trong vòng một thập kỷ
Trên web cũng vậy, từng có giai đoạn JS chỉ dùng để bổ trợ UX, rồi sau đó ứng dụng trang đơn trở thành tiêu chuẩn
Điểm cốt lõi là, trừ khi bạn phải có mặt trong danh sách 'influencer cốt lõi', còn không thì chiến lược tốt hơn nhiều là cứ lặng lẽ chờ tới lúc nó thực sự quan trọng với mình
Tôi cũng từng bỏ qua toàn bộ xu hướng phát triển web suốt 10 năm kể từ thời backbone.js, rồi tới lúc cần React thì học vài ngày là dùng được ngay
LSTM cũng vậy, 5 năm trước ai cũng muốn học cách tự triển khai, còn giờ thì đã thành đồ cũ vì transformer
Điều tôi luôn cảm nhận trong suốt sự nghiệp là, "di chuyển nhanh" nghĩa là "chưa trưởng thành"
Thậm chí học các mô hình thống kê cũ hơn (GLM v.v.) và cách áp dụng thực tế của chúng còn cho ra lời giải hiệu quả trong công việc hơn rất nhiều so với việc đuổi theo các 'prompt hack' đang thịnh hành từng thời điểm
Thứ nhất là công cụ mới hơi khác công cụ cũ hoặc cho hiệu năng nhỉnh hơn một chút (nếu có tính năng chưa từng có thì đáng thử, nhưng đa số sẽ sớm lỗi thời)
Những cái tên như Kimi-K2 hay GPT 4.1 có thể vài tháng nữa chẳng còn ai nhắc đến
Thứ hai là khi mô hình thực sự được bổ sung năng lực mới
Ví dụ như RL(reinforcement learning), chain of thought, coding agent thực sự hoạt động được, mô hình đa phương thức cấp độ đỉnh, hay tích hợp công cụ thông minh
Chỉ cần chú ý khi có những cú nhảy lớn như vậy là đủ
Thực tế, chỉ cần lướt các bài HN trên 500 point là tự nhiên cũng nắm được xu hướng mới nhất
Tôi nghĩ cách tốt nhất để hiểu năng lực thật sự của LLM không phải blog hay video, mà là tự làm thử và va chạm trực tiếp
Vốn dĩ nghiên cứu thì 99% là tiến bộ tiệm tiến (điều này tự nó cũng hoàn toàn bình thường, đừng vì thế mà nản)
Phần lớn bài báo dài hơn mức cần thiết, và nếu đọc nghiêm túc thì chỉ với trực giác toán học cũng có thể đoán được phần nào (biết ý tưởng là đã có thể ước lượng kết quả)
Rất dễ có cảm giác lĩnh vực thay đổi cực nhanh, nhưng thực tế tốc độ không nhanh đến thế
Tôi cũng từng nghỉ 1 năm vì việc riêng rồi quay lại, và nhận ra chẳng có gì thay đổi quá lớn
Có được góc nhìn này sẽ giúp thoát khỏi áp lực phải "theo kịp"
Nếu lúc này bạn đang thấy khó, thì đó chỉ có nghĩa là chuyên môn của bạn còn chưa đủ sâu, chứ không có nghĩa là bạn đã bị bỏ lại phía sau
Cũng như ai muốn chạy thì phải học đi trước, việc chậm một bước chỉ là nỗi lo trong đầu mình mà thôi
Bản thân thuật toán lõi thực tế (cách dự đoán token tiếp theo) thì với đa số người không chuyên lại không thật sự gợi hình
Các chi tiết như dot product hay embedding thì hầu như chẳng ai quan tâm. Giải thích ra cũng khó đọng lại và không giúp được bao nhiêu
Không nhất thiết phải chạy theo "xu hướng mới nhất"; tôi nghĩ tốt hơn là chỉ giữ quan tâm ở mức lỏng, rồi chọn lọc thử những tính năng/kỹ thuật nào thực sự giúp tăng hiệu suất của mình và tích lũy những thứ đáng dùng (kiểu ai đó trên X đề xuất gì thì tôi không tin lắm). Ngược lại, tôi đã học được nhiều từ quan điểm của những nhà nghiên cứu có cái nhìn tiêu cực hơn với cơn cường điệu AI [https://x.com/burkov]. Hiện tại có quá nhiều phóng đại, thay đổi và bất định. Nếu có đổi mới thật sự xuất hiện thì chắc chắn sẽ nghe thấy trên HN (hoặc các cộng đồng chính thống)
Tôi thấy bài viết không giải thích tốt phần "vì sao", nên phần "làm thế nào" trong danh sách thiếu sức thuyết phục. Thời gian quý giá của tôi có thể dùng vào việc khác vẫn hơn
Tôi đang đăng ký newsletter "Pragmatic Engineer" của Gergeley Orosz (dạo này có nhiều chủ đề AI), và cũng theo dõi Substack của Gary Marcus (góc nhìn hoài nghi hơn với LLM)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
Ngoài ra tôi cũng tự động theo dõi tin tức về các package Python như Langchain, PydanticAI (những dự án như vậy phần nào phản ánh xu hướng thực tế của ngành). Tôi không còn dùng X(Twitter) nữa, nhưng những người như Simon Willison vẫn thỉnh thoảng đăng trên BlueSky và Mastodon. Sebastian Raschka, Chip Huyen v.v. cũng đăng trên LinkedIn. Tin tức tuy rải rác khắp nơi, nhưng rốt cuộc hầu hết tin quan trọng vẫn sẽ đến được với mình
Có thể tôi đã bỏ lỡ điều gì đó quan trọng, nhưng các cập nhật cốt lõi và có ý nghĩa thì kiểu gì cũng sẽ được nhắc đến tự nhiên trên trang chính HN hoặc trong phần bình luận
Nếu mục tiêu là theo dõi tin tức về LLM và các mô hình frontier AI, thì danh sách được đề xuất là rất tốt, hơn một nửa trong đó cũng là những người mà tôi tự tìm ra riêng
Tôi tạo danh sách các tài khoản AI trên X(Twitter) để theo dõi, và nhìn chung đó là nguồn thông tin vững chắc nhất
Một số blog và RSS podcast cũng khá hữu ích (nếu là nhà nghiên cứu thì RSS của chính bài báo là thứ bắt buộc)
Những nguồn tôi muốn bổ sung là https://epoch.ai, podcast của Dwarkesh Patel, blog của Peter Wildeford, @omarsar0(DAIR elvis), cùng việc theo dõi trực tiếp nhiều nhà nghiên cứu khác nhau (một số người trong đó nghiêng về giải trí hơn là truyền tải thông tin)
Môi trường thông tin của lĩnh vực này bị ô nhiễm nghiêm trọng. Đặc biệt nếu chỉ theo dõi các cơ quan báo chí như NYT vốn khai thác chủ yếu dưới góc chính trị, thì bạn lại càng dễ có được bức tranh thiên lệch và thiếu chính xác
Cũng cần lưu ý rằng các mảng ML không liên quan trực tiếp đến generative AI (ví dụ: protein, hệ gen, mô hình thời tiết, nghiên cứu diffusion/tạo ảnh v.v.) có nguồn thông tin hoàn toàn khác
Phạm vi AI/ML quá rộng nên không thể theo kịp tất cả cùng lúc
Còn có nhất thiết phải theo dõi không thì, không hẳn
Phần lớn chỉ là vì tò mò với công nghệ mới/xu hướng mới nhất
Tuy vậy, ở những lĩnh vực như phát triển phần mềm, nếu hoàn toàn phớt lờ AI thì về trung và dài hạn có thể rất bất lợi cho sự nghiệp (chỉ cần ứng phó bằng cách học dùng công cụ thôi cũng được)
Riêng tôi thì do tính chất công việc cần nắm được xu hướng tổng thể nên vẫn theo dõi đều đặn
Chỉ riêng blog của Simon Willison cũng đã đủ để học thông tin chất lượng cao và cập nhật mới nhất (gần như không có nhiễu, tỉ lệ S/N cực cao)
Không cần phải cố chạy theo 'xu hướng'
Việc làm công nghệ đang ngày càng ít đi, và rồi sẽ có lúc giảm mạnh (AI sẽ khiến một người làm được phần việc của 10 người, sau đó đến lao động văn phòng, rồi cả lao động tay chân như robot trong kho Amazon cũng vậy)
Cá nhân tôi đã hủy gói GPT Plus trong tuần này, tôi không còn muốn nuôi 'con quái vật' đó nữa
Những tính năng như hỗ trợ bản đồ (ví dụ: lộ trình du lịch, cung đường đạp vòng với bạn bè v.v.) thì bản miễn phí của Gemini thậm chí còn làm tốt hơn
Chỉ cần theo gợi ý đầu tiên (đọc blog của simow) thì hầu như là đủ
Tôi đã nhận được rất nhiều trợ giúp từ các bài giảng của Andrej Karpathy
Có trên YouTube nữa(https://www.youtube.com/@AndrejKarpathy)
Tôi vốn ở vị trí cố vấn/hỗ trợ các nhà nghiên cứu machine learning, nhưng mỗi lần nghe Andrej nói tôi lại thấy mình như một sinh viên chẳng biết gì
Lúc đầu cảm giác đó khá lạ, nhưng giờ tôi thấy chính sự khiêm tốn ấy là một tài sản cực kỳ quý giá
Tâm thế "tôi chẳng biết gì cả" thực sự rất quan trọng
hu hu nhìn khó đọc quá
Nếu bạn cảm thấy mức này là khó đọc, thì có lẽ vấn đề không nằm ở phần nội dung chính.
Tôi đồng ý.
Một kiểu viết lách mang tính thiết yếu trong thời điểm hiện tại.