87 điểm bởi GN⁺ 2025-07-21 | 5 bình luận | Chia sẻ qua WhatsApp
  • AI tạo sinh là công nghệ phát triển nhanh nhất hiện nay, và cả đánh giá thấp lẫn đánh giá quá cao đều nguy hiểm
  • Theo dõi đều đặn các nguồn uy tín và chuyên gia đáng tin cậy là điều bắt buộc
  • Khuyến nghị một pipeline thông tin cân bằng như Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
  • Thông báo chính thức từ các phòng thí nghiệm AI, blog kỹ thuật, bài báo học thuật là thiết yếu để nắm bắt tiến bộ thực tế và các giới hạn của công nghệ
  • Có thể tiếp cận cả xu hướng mới nhất lẫn phân tích chuyên sâu qua nhiều kênh như Twitter/X, bản tin tuyển chọn tin tức, danh sách chuyên gia

Mở đầu: Hiểu lầm về AI và ô nhiễm thông tin

  • AI tạo sinh là công nghệ phát triển nhanh nhất trong cuộc đời của tác giả
  • Nhưng những hiểu lầm về AI cũng lan tràn, và bản thân môi trường thông tin hiện nay rất hỗn loạn
  • Thực tế đã có những trường hợp doanh nghiệp, chính phủ hoặc cá nhân không hiểu đủ về công nghệ liên quan, dẫn đến lạm dụng hoặc gây ra thiệt hại nghiêm trọng
  • Tồn tại hai cực hiểu sai: hoặc đánh giá thấp AI (“một trào lưu sớm tàn”), hoặc đánh giá quá cao (“lập trình viên không còn cần thiết nữa”)
  • Sự thiếu hiểu biết đúng đắn về công nghệ là gốc rễ của những ngộ nhận này

Cách tiếp cận để tiếp nhận thông tin về AI

  • Hiểu đúng thông tin liên quan đến AI không hề dễ như nhiều người nghĩ
  • Đây là môi trường mà thông tin méo mó, phóng đại hoặc các diễn ngôn bị kìm nén xuất hiện hằng ngày
  • Nếu không chủ động và có hệ thống trong việc sàng lọc thông tin, bạn sẽ dễ phơi nhiễm trước sai sót, cường điệu và bóp méo
  • Tác giả cho biết mình được hỗ trợ rất nhiều nhờ xây dựng một pipeline thông tin cân bằng, và khuyến nghị đây là điểm khởi đầu tốt cho người mới

Những nguyên tắc chung khi tiếp nhận thông tin

  • Điều quan trọng là tham khảo thông tin càng gần nguồn gốc càng tốt
    • Cần kiểm tra các thông báo chính thức từ các phòng thí nghiệm AI hoặc ý kiến của những nhân vật chủ chốt như nguồn sơ cấp
    • Cần giữ thái độ không quá tin vào các bài tường thuật cấp 2, cấp 3
  • Cũng cần chủ động tìm và tham khảo bình luận từ các chuyên gia đáng tin cậy

Những điểm khởi đầu được khuyến nghị

  • Simon Willison’s Blog

  • Andrej Karpathy

    • Twitter/X | YouTube
    • Thành viên sáng lập OpenAI và cựu giám đốc AI tại Tesla
    • Đây là kênh dễ học nhất về cấu trúc bên trong và nguyên lý của mô hình AI, đồng thời cũng giúp quan sát ảnh hưởng văn hóa và những thay đổi xã hội do AI tạo ra
    • Ví dụ: Deep Dive into LLMs like ChatGPT, How I Use LLMs
Quảng cáo

Every’s Chain of Thought

Cách theo dõi tài liệu chính thức từ các phòng thí nghiệm AI

Các chuyên gia AI và kỹ sư thực chiến đáng chú ý

  • Thông tin từ những chuyên gia từng làm công cụ mã nguồn mở hoặc có kinh nghiệm thực tế về AI engineering thường hữu ích hơn hướng dẫn chính thức trong nhiều trường hợp

Những nhân vật và blog tiêu biểu được khuyến nghị

Tận dụng tin tức/truyền thông và cộng đồng AI

  • Twitter/X

    • Danh sách Twitter/X
    • Trung tâm của thảo luận thời gian thực và tiếp nhận thông tin về AI, nơi có thể nắm bắt đủ loại tin tức và tranh luận
      • Hãy tiêu thụ feed Twitter như đọc báo trong 15~20 phút, và khi cần thì theo dõi thêm nhân vật hoặc nguồn mới
  • Shawn Wang(swyx) / smol.ai

  • Dwarkesh Patel

    Quảng cáo

Cộng đồng thảo luận/tài liệu chuyên sâu về AI

Cách thực hành tiếp nhận thông tin

  • Không cần theo dõi hoàn hảo mọi nguồn; cách thực tế là xem feed Twitter như đọc báo
  • Khi gặp một bài viết thú vị, nên theo dõi tác giả đó và mở rộng việc đọc sang các công trình khác của họ
  • Đây là cách khám phá thông tin tương tự như việc từng khám phá âm nhạc trong quá khứ
  • Nếu tiếp cận nó như một cuộc khám phá trí tuệ, nó có thể trở thành niềm vui thay vì nghĩa vụ

Kết luận và danh sách khuyến nghị

  • Thông qua danh sách Twitter/X được cung cấp, bạn có thể theo dõi cùng lúc các chuyên gia và người làm thực tế nêu trên
  • Tác giả cũng dự định sớm bổ sung thêm danh sách ở định dạng RSS

Đi đến danh sách Twitter

5 bình luận

 
GN⁺ 2025-07-21
Ý kiến Hacker News
  • Nếu hiểu cơ bản về cách LLM hoạt động, thì tôi nghĩ không cần phải bám theo toàn bộ luồng nội dung liên tục từ PR, blogger, lãnh đạo ngành hay các "nhà tư tưởng" trên Internet
    Ngược lại, nếu cứ chạy theo các bài phỏng vấn hay bài viết kiểu đó thì rất dễ bị cuốn vào những trào lưu kỳ quặc mà thực tế chẳng giúp ích gì
    Thực tế, khác biệt giữa các mô hình trong vài năm qua chủ yếu chỉ là chênh lệch về mức độ, chứ không có khác biệt bản chất quá lớn; hiện nay phần lớn thay đổi diễn ra ở công cụ hoặc khâu tích hợp
    Cần luôn nhớ rằng LLM rốt cuộc là "mô hình văn bản" và được sinh ra mà không có tri thức nền, như vậy sẽ dễ phân biệt nó hữu ích ở đâu và không phù hợp ở đâu

    • Tôi thật sự đồng ý với ý kiến này, và cũng cảm thấy danh sách 'high signal' của blog đó thực ra phần lớn là những nhân vật tự quảng bá bản thân (dù tất nhiên cũng có vài người rất tốt), nên cấu thành của nó gần với "buzz" hơn là insight
      Cá nhân tôi cũng không đồng cảm lắm với nhận định rằng "AI là công nghệ phát triển nhanh nhất trong đời tôi"
      Tôi đã trải qua thời SVM nổi lên, thời mạng nơ-ron bị xem như trò đùa, rồi thời deep learning và hàng loạt framework DL bùng nổ trong hơn 10 năm qua
      Khi đó cũng đã có những bước phát triển cực kỳ chóng mặt trong vòng một thập kỷ
      Trên web cũng vậy, từng có giai đoạn JS chỉ dùng để bổ trợ UX, rồi sau đó ứng dụng trang đơn trở thành tiêu chuẩn
      Điểm cốt lõi là, trừ khi bạn phải có mặt trong danh sách 'influencer cốt lõi', còn không thì chiến lược tốt hơn nhiều là cứ lặng lẽ chờ tới lúc nó thực sự quan trọng với mình
      Tôi cũng từng bỏ qua toàn bộ xu hướng phát triển web suốt 10 năm kể từ thời backbone.js, rồi tới lúc cần React thì học vài ngày là dùng được ngay
      LSTM cũng vậy, 5 năm trước ai cũng muốn học cách tự triển khai, còn giờ thì đã thành đồ cũ vì transformer
      Điều tôi luôn cảm nhận trong suốt sự nghiệp là, "di chuyển nhanh" nghĩa là "chưa trưởng thành"
      Thậm chí học các mô hình thống kê cũ hơn (GLM v.v.) và cách áp dụng thực tế của chúng còn cho ra lời giải hiệu quả trong công việc hơn rất nhiều so với việc đuổi theo các 'prompt hack' đang thịnh hành từng thời điểm
    • Chỉ cần nắm sơ cấu trúc LLM thì hầu hết tin tức mới về LLM sẽ rơi vào hai nhóm
      Thứ nhất là công cụ mới hơi khác công cụ cũ hoặc cho hiệu năng nhỉnh hơn một chút (nếu có tính năng chưa từng có thì đáng thử, nhưng đa số sẽ sớm lỗi thời)
      Những cái tên như Kimi-K2 hay GPT 4.1 có thể vài tháng nữa chẳng còn ai nhắc đến
      Thứ hai là khi mô hình thực sự được bổ sung năng lực mới
      Ví dụ như RL(reinforcement learning), chain of thought, coding agent thực sự hoạt động được, mô hình đa phương thức cấp độ đỉnh, hay tích hợp công cụ thông minh
      Chỉ cần chú ý khi có những cú nhảy lớn như vậy là đủ
      Thực tế, chỉ cần lướt các bài HN trên 500 point là tự nhiên cũng nắm được xu hướng mới nhất
      Tôi nghĩ cách tốt nhất để hiểu năng lực thật sự của LLM không phải blog hay video, mà là tự làm thử và va chạm trực tiếp
    • Hoàn toàn đồng ý. Tôi luôn nhấn mạnh điều này với sinh viên
      • 1. Đừng quá chìm trong trải nghiệm của người khác, hãy tập trung vào trải nghiệm trực tiếp của chính mình
      • 2. Thay vì đọc blog, hãy tự xây ứng dụng
      • 3. Trải nghiệm của mỗi người khác nhau rất nhiều, nên đừng bê nguyên suy nghĩ của người khác
      • 4. Đừng mù quáng chạy theo các nhà nghiên cứu hay lập trình viên trên Twitter, Substack (phần lớn là đang trưng bày bản thân)
      • 5. Đừng lãng phí thời gian vào lo âu hay FOMO, cứ tự làm rồi học. Những thay đổi thật sự quan trọng thì sớm muộn gì bạn cũng sẽ biết
      • 6. Biết thông tin là quan trọng, nhưng đừng ám ảnh cưỡng chế với bản thân thông tin đó. Hãy phân bổ thời gian một cách thông minh. Tôi luôn nhấn mạnh điểm này với sinh viên
    • Thật ra điều này cũng đúng với giới nghiên cứu
      Vốn dĩ nghiên cứu thì 99% là tiến bộ tiệm tiến (điều này tự nó cũng hoàn toàn bình thường, đừng vì thế mà nản)
      Phần lớn bài báo dài hơn mức cần thiết, và nếu đọc nghiêm túc thì chỉ với trực giác toán học cũng có thể đoán được phần nào (biết ý tưởng là đã có thể ước lượng kết quả)
      Rất dễ có cảm giác lĩnh vực thay đổi cực nhanh, nhưng thực tế tốc độ không nhanh đến thế
      Tôi cũng từng nghỉ 1 năm vì việc riêng rồi quay lại, và nhận ra chẳng có gì thay đổi quá lớn
      Có được góc nhìn này sẽ giúp thoát khỏi áp lực phải "theo kịp"
      Nếu lúc này bạn đang thấy khó, thì đó chỉ có nghĩa là chuyên môn của bạn còn chưa đủ sâu, chứ không có nghĩa là bạn đã bị bỏ lại phía sau
      Cũng như ai muốn chạy thì phải học đi trước, việc chậm một bước chỉ là nỗi lo trong đầu mình mà thôi
    • Khi giải thích về LLM, phần khiến người ta hứng thú nhất không phải kiến trúc mà là "dự đoán theo từng token (autoregression)" và việc nó không nhất thiết luôn chọn token có xác suất cao nhất, mà lấy mẫu theo phân phối xác suất
      Bản thân thuật toán lõi thực tế (cách dự đoán token tiếp theo) thì với đa số người không chuyên lại không thật sự gợi hình
      Các chi tiết như dot product hay embedding thì hầu như chẳng ai quan tâm. Giải thích ra cũng khó đọng lại và không giúp được bao nhiêu
  • Không nhất thiết phải chạy theo "xu hướng mới nhất"; tôi nghĩ tốt hơn là chỉ giữ quan tâm ở mức lỏng, rồi chọn lọc thử những tính năng/kỹ thuật nào thực sự giúp tăng hiệu suất của mình và tích lũy những thứ đáng dùng (kiểu ai đó trên X đề xuất gì thì tôi không tin lắm). Ngược lại, tôi đã học được nhiều từ quan điểm của những nhà nghiên cứu có cái nhìn tiêu cực hơn với cơn cường điệu AI [https://x.com/burkov]. Hiện tại có quá nhiều phóng đại, thay đổi và bất định. Nếu có đổi mới thật sự xuất hiện thì chắc chắn sẽ nghe thấy trên HN (hoặc các cộng đồng chính thống)

    • Tự tay dùng thử dù chỉ vài tiếng cũng là trải nghiệm học tập giá trị hơn nhiều giờ đọc tài liệu
  • Tôi thấy bài viết không giải thích tốt phần "vì sao", nên phần "làm thế nào" trong danh sách thiếu sức thuyết phục. Thời gian quý giá của tôi có thể dùng vào việc khác vẫn hơn

    • Tôi thật sự tự hỏi có cần phải "liên tục theo dõi" thứ gì đó hay không. Những đổi mới có ý nghĩa thực chất cuối cùng rồi cũng sẽ phổ cập và tự nhiên đến với tôi. Như Excel hay Google Docs, ban đầu tôi cũng chẳng quan tâm mấy, nhưng sau khi phổ biến thì vẫn học và dùng rất tốt. Trừ khi có lý do rõ ràng phải chạy gấp theo, ví dụ như runway của startup AI chỉ còn rất ít, còn không thì chẳng cần phải sốt ruột
  • Tôi đang đăng ký newsletter "Pragmatic Engineer" của Gergeley Orosz (dạo này có nhiều chủ đề AI), và cũng theo dõi Substack của Gary Marcus (góc nhìn hoài nghi hơn với LLM)
    https://newsletter.pragmaticengineer.com/
    https://substack.com/@garymarcus
    Ngoài ra tôi cũng tự động theo dõi tin tức về các package Python như Langchain, PydanticAI (những dự án như vậy phần nào phản ánh xu hướng thực tế của ngành). Tôi không còn dùng X(Twitter) nữa, nhưng những người như Simon Willison vẫn thỉnh thoảng đăng trên BlueSky và Mastodon. Sebastian Raschka, Chip Huyen v.v. cũng đăng trên LinkedIn. Tin tức tuy rải rác khắp nơi, nhưng rốt cuộc hầu hết tin quan trọng vẫn sẽ đến được với mình

  • Có thể tôi đã bỏ lỡ điều gì đó quan trọng, nhưng các cập nhật cốt lõi và có ý nghĩa thì kiểu gì cũng sẽ được nhắc đến tự nhiên trên trang chính HN hoặc trong phần bình luận

    • Cố theo kịp chuyển động của ngành chẳng khác nào nhảy lên máy chạy bộ đang chạy ở 140km/h. Tôi đã từ bỏ luôn việc phải chạy theo. Tôi đồng ý rằng AI (đặc biệt là LLM) không phải trào lưu nhất thời, nhưng hiện giờ biến động quá mạnh. Cho đến khi thực sự cần, tôi không định đầu tư quá nhiều thời gian. Hy vọng vài năm nữa cục diện ngành sẽ rõ ràng hơn. Mà kể cả không như vậy, ít nhất tôi cũng tránh lãng phí thời gian vào những xu hướng sẽ nhanh chóng thành vô nghĩa. Nói thêm là hiện tại tôi hoàn toàn không dùng AI hay LLM trong công việc thực tế
    • Các công ty đã đổ vào quá nhiều đầu tư và R&D nên trái lại họ không hề muốn che giấu công nghệ của mình (gần như ngược hẳn với bí mật hóa)
    • Tôi xử lý mọi xu hướng trong toàn bộ ngành IT theo cách này
  • Nếu mục tiêu là theo dõi tin tức về LLM và các mô hình frontier AI, thì danh sách được đề xuất là rất tốt, hơn một nửa trong đó cũng là những người mà tôi tự tìm ra riêng
    Tôi tạo danh sách các tài khoản AI trên X(Twitter) để theo dõi, và nhìn chung đó là nguồn thông tin vững chắc nhất
    Một số blog và RSS podcast cũng khá hữu ích (nếu là nhà nghiên cứu thì RSS của chính bài báo là thứ bắt buộc)
    Những nguồn tôi muốn bổ sung là https://epoch.ai, podcast của Dwarkesh Patel, blog của Peter Wildeford, @omarsar0(DAIR elvis), cùng việc theo dõi trực tiếp nhiều nhà nghiên cứu khác nhau (một số người trong đó nghiêng về giải trí hơn là truyền tải thông tin)
    Môi trường thông tin của lĩnh vực này bị ô nhiễm nghiêm trọng. Đặc biệt nếu chỉ theo dõi các cơ quan báo chí như NYT vốn khai thác chủ yếu dưới góc chính trị, thì bạn lại càng dễ có được bức tranh thiên lệch và thiếu chính xác
    Cũng cần lưu ý rằng các mảng ML không liên quan trực tiếp đến generative AI (ví dụ: protein, hệ gen, mô hình thời tiết, nghiên cứu diffusion/tạo ảnh v.v.) có nguồn thông tin hoàn toàn khác
    Phạm vi AI/ML quá rộng nên không thể theo kịp tất cả cùng lúc
    Còn có nhất thiết phải theo dõi không thì, không hẳn
    Phần lớn chỉ là vì tò mò với công nghệ mới/xu hướng mới nhất
    Tuy vậy, ở những lĩnh vực như phát triển phần mềm, nếu hoàn toàn phớt lờ AI thì về trung và dài hạn có thể rất bất lợi cho sự nghiệp (chỉ cần ứng phó bằng cách học dùng công cụ thôi cũng được)
    Riêng tôi thì do tính chất công việc cần nắm được xu hướng tổng thể nên vẫn theo dõi đều đặn

  • Chỉ riêng blog của Simon Willison cũng đã đủ để học thông tin chất lượng cao và cập nhật mới nhất (gần như không có nhiễu, tỉ lệ S/N cực cao)

    • Nếu tài trợ cho Simon trên GitHub ($10 trở lên) thì bạn có thể nhận email "bản tóm tắt các ý chính với dung lượng ít hơn"

      "Tóm tắt những phát triển quan trọng nhất trong lĩnh vực LLM của tháng vừa qua (đọc hết trong chưa đến 10 phút)"
      https://simonwillison.net/about/

    • https://simonwillison.net
    • May mắn là còn có cả RSS feed nên có thể theo dõi cả code lẫn tin tức
  • Không cần phải cố chạy theo 'xu hướng'

    • Đúng vậy, giờ là lúc dừng lại và làm chuyện khác
    • Thực ra rời hẳn ngành công nghệ để xây một sự nghiệp mới cũng là một cách
      Việc làm công nghệ đang ngày càng ít đi, và rồi sẽ có lúc giảm mạnh (AI sẽ khiến một người làm được phần việc của 10 người, sau đó đến lao động văn phòng, rồi cả lao động tay chân như robot trong kho Amazon cũng vậy)
      Cá nhân tôi đã hủy gói GPT Plus trong tuần này, tôi không còn muốn nuôi 'con quái vật' đó nữa
      Những tính năng như hỗ trợ bản đồ (ví dụ: lộ trình du lịch, cung đường đạp vòng với bạn bè v.v.) thì bản miễn phí của Gemini thậm chí còn làm tốt hơn
  • Chỉ cần theo gợi ý đầu tiên (đọc blog của simow) thì hầu như là đủ

    • Ngay cả thế tôi cũng lười, nên thay bằng video của Fireship lúc uống cà phê sáng
    • Rất đáng khuyên dùng - tóm tắt cực chất lượng mà gần như không clickbait
  • Tôi đã nhận được rất nhiều trợ giúp từ các bài giảng của Andrej Karpathy
    Có trên YouTube nữa(https://www.youtube.com/@AndrejKarpathy)
    Tôi vốn ở vị trí cố vấn/hỗ trợ các nhà nghiên cứu machine learning, nhưng mỗi lần nghe Andrej nói tôi lại thấy mình như một sinh viên chẳng biết gì
    Lúc đầu cảm giác đó khá lạ, nhưng giờ tôi thấy chính sự khiêm tốn ấy là một tài sản cực kỳ quý giá
    Tâm thế "tôi chẳng biết gì cả" thực sự rất quan trọng

 
makers 2025-07-22

hu hu nhìn khó đọc quá

 
reagea0 2025-07-23

Nếu bạn cảm thấy mức này là khó đọc, thì có lẽ vấn đề không nằm ở phần nội dung chính.

 
harris 2025-07-28

Tôi đồng ý.

 
supermaxi 2025-07-22

Một kiểu viết lách mang tính thiết yếu trong thời điểm hiện tại.