1 điểm bởi GN⁺ 2025-03-12 | 1 bình luận | Chia sẻ qua WhatsApp

Trí tuệ nhân tạo xác suất

  • Trí tuệ nhân tạo là khoa học và kỹ thuật về các hệ thống nhân tạo có thể thực hiện những tác vụ đòi hỏi trí thông minh của con người. Trong vài năm gần đây, đã có những bước tiến thú vị trong cách tiếp cận lấy dữ liệu làm trung tâm dựa trên học tập, và machine learning cùng deep learning đã mở ra những cách thức mới để hệ thống máy tính nhận thức thế giới. Reinforcement learning đã tạo ra các đột phá trong những trò chơi phức tạp như cờ vây và trong các bài toán robot học.

  • Một khía cạnh cốt lõi của trí thông minh không chỉ là đưa ra dự đoán mà còn là hiểu được độ bất định của những dự đoán đó, và cân nhắc độ bất định này khi ra quyết định. Bài báo này nói về "trí tuệ nhân tạo xác suất".

Cách tiếp cận xác suất

  • Phần đầu tiên đề cập đến cách tiếp cận xác suất đối với machine learning. Bài viết thảo luận sự khác biệt giữa độ bất định "nhận thức" do thiếu dữ liệu và độ bất định "ngẫu nhiên", chẳng hạn phát sinh từ các quan sát và kết quả có nhiễu. Bài viết cũng thảo luận các cách tiếp cận cụ thể cho suy luận xác suất và các cách tiếp cận hiện đại cho suy luận xấp xỉ hiệu quả.

Xem xét độ bất định trong các bài toán ra quyết định tuần tự

  • Phần thứ hai đề cập đến việc xem xét độ bất định trong các bài toán ra quyết định tuần tự. Bài viết xem xét active learning và Bayesian optimization, đây là những cách tiếp cận thu thập dữ liệu bằng cách đề xuất các thí nghiệm cung cấp thông tin nhằm giảm độ bất định nhận thức. Bài viết xem xét reinforcement learning và các cách tiếp cận deep RL hiện đại sử dụng phép xấp xỉ hàm bằng mạng nơ-ron. Bài viết thảo luận các cách tiếp cận hiện đại của RL dựa trên mô hình, vốn tận dụng độ bất định nhận thức và ngẫu nhiên để định hướng quá trình khám phá và cân nhắc tính an toàn.

1 bình luận

 
GN⁺ 2025-03-12
Ý kiến trên Hacker News
  • Văn bản có các sơ đồ giải thích rất hay và dường như cung cấp một cái nhìn tổng quan chất lượng cao về machine learning từ góc độ xác suất

    • Gần đây tôi rất ấn tượng với giáo trình miễn phí và các bài giảng YouTube của Zhao có tên "Mathematical Foundation of Reinforcement Learning"
    • Nếu không có nhiều thời gian, bạn nên lướt qua sơ đồ tổng quan của Zhao. Đây là một bản đồ khái niệm rất tốt cho toàn bộ lĩnh vực
    • Và cũng nên xem video giới thiệu
  • Tôi đã tìm thấy tài liệu này vài ngày trước và muốn có một cái cớ để xem kỹ hơn, vì Andreas Krause đã thực hiện những nghiên cứu sâu sắc và thú vị về Gaussian Processes và Bandits

  • Thực tại hiện sinh là một phân bố tiềm năng chứ không phải một mảng trạng thái

    • Tiềm năng tồn tại, và xác suất là mô tả toán học của phân bố đó. Mọi thuộc tính đều là các chiều (vector)
    • Trạng thái chỉ là phép đo tức thời của sự phân giải. Tiềm năng tương tác thông qua giao thoa tăng cường và triệt tiêu
    • Giao thoa tăng cường và triệt tiêu được phân giải thành trạng thái "bây giờ" của phép đo tức thời
  • Một câu hỏi về việc liệu LLM (tức neural network) có thể cho biết xác suất của câu trả lời mà nó vừa đưa ra hay không

    • Từ lâu hồi đại học tôi đã học những thứ này và từng tạo một trình thông dịch Prolog với xác suất và hệ số tin cậy cho từng thuật ngữ
  • Tôi nghĩ cần có GUI để dân chủ hóa khả năng diễn giải mô hình và để cả game thủ cũng có thể khám phá

    • Về cơ bản là huấn luyện một mô hình khác để chuyển LLM thành dạng 3D rồi đặt nó vào một thế giới 3D mà con người có thể hiểu được
    • Ví dụ đơn giản là biểu diễn LLM như một cánh đồng xanh cùng các vật thể, và đặt con người làm tác nhân duy nhất
  • Tôi nghĩ Gaussian Processes với kernel phù hợp có thể rất mạnh chỉ với vài điểm dữ liệu và một bộ tham số nhỏ

    • Tôi đã dùng nó trong công việc computer vision như một quy trình phi tuyến có thể dự đoán để điều chỉnh đầu vào, và kết quả rất tốt
  • Có vẻ đây là tài liệu tham khảo tốt nhất về chủ đề này và phần nào chồng lấn với nó. Có nhắc đến "An Introduction to Statistical Learning" của Gareth James và cộng sự

    • Tôi tự hỏi liệu tài liệu này có dễ tiếp cận hơn không, và các ví dụ R/Python sẽ rất hữu ích
  • Kevin Murphy đang đổi tên series Probabilistic Machine Learning của ông ấy

  • Gemini 2.0 Experimental 02-05 xem tài liệu này chỉ là 107K token

    • Nếu cần giúp phân tích nó thì điều này khá hữu ích
  • Laplace Approximation là một cách "nhanh và đơn giản" để biến một phân bố xác suất phức tạp thành một Gaussian đơn giản (đường cong hình chuông)

    • Nó hoạt động bằng cách tìm điểm cao nhất rồi khớp độ cong tại điểm đó
    • Nó nhanh và dễ, nhưng nếu phân bố thực tế khác đường cong hình chuông thì có thể rất thiếu chính xác và quá tự tin
  • Tôi đã học môn này tại ETH Zurich và đây là một trong những môn tôi thích nhất

    • Tôi đặc biệt ấn tượng với cách định lượng độ bất định và cách xây dựng các khối khởi đầu cho reinforcement learning
    • Đây là tài liệu đọc rất hay cho data scientist và ML engineer. Tài liệu này là ghi chú bài giảng