Công nghệ trí tuệ nhân tạo xác suất
(arxiv.org)Trí tuệ nhân tạo xác suất
-
Trí tuệ nhân tạo là khoa học và kỹ thuật về các hệ thống nhân tạo có thể thực hiện những tác vụ đòi hỏi trí thông minh của con người. Trong vài năm gần đây, đã có những bước tiến thú vị trong cách tiếp cận lấy dữ liệu làm trung tâm dựa trên học tập, và machine learning cùng deep learning đã mở ra những cách thức mới để hệ thống máy tính nhận thức thế giới. Reinforcement learning đã tạo ra các đột phá trong những trò chơi phức tạp như cờ vây và trong các bài toán robot học.
-
Một khía cạnh cốt lõi của trí thông minh không chỉ là đưa ra dự đoán mà còn là hiểu được độ bất định của những dự đoán đó, và cân nhắc độ bất định này khi ra quyết định. Bài báo này nói về "trí tuệ nhân tạo xác suất".
Cách tiếp cận xác suất
- Phần đầu tiên đề cập đến cách tiếp cận xác suất đối với machine learning. Bài viết thảo luận sự khác biệt giữa độ bất định "nhận thức" do thiếu dữ liệu và độ bất định "ngẫu nhiên", chẳng hạn phát sinh từ các quan sát và kết quả có nhiễu. Bài viết cũng thảo luận các cách tiếp cận cụ thể cho suy luận xác suất và các cách tiếp cận hiện đại cho suy luận xấp xỉ hiệu quả.
Xem xét độ bất định trong các bài toán ra quyết định tuần tự
- Phần thứ hai đề cập đến việc xem xét độ bất định trong các bài toán ra quyết định tuần tự. Bài viết xem xét active learning và Bayesian optimization, đây là những cách tiếp cận thu thập dữ liệu bằng cách đề xuất các thí nghiệm cung cấp thông tin nhằm giảm độ bất định nhận thức. Bài viết xem xét reinforcement learning và các cách tiếp cận deep RL hiện đại sử dụng phép xấp xỉ hàm bằng mạng nơ-ron. Bài viết thảo luận các cách tiếp cận hiện đại của RL dựa trên mô hình, vốn tận dụng độ bất định nhận thức và ngẫu nhiên để định hướng quá trình khám phá và cân nhắc tính an toàn.
1 bình luận
Ý kiến trên Hacker News
Văn bản có các sơ đồ giải thích rất hay và dường như cung cấp một cái nhìn tổng quan chất lượng cao về machine learning từ góc độ xác suất
Tôi đã tìm thấy tài liệu này vài ngày trước và muốn có một cái cớ để xem kỹ hơn, vì Andreas Krause đã thực hiện những nghiên cứu sâu sắc và thú vị về Gaussian Processes và Bandits
Thực tại hiện sinh là một phân bố tiềm năng chứ không phải một mảng trạng thái
Một câu hỏi về việc liệu LLM (tức neural network) có thể cho biết xác suất của câu trả lời mà nó vừa đưa ra hay không
Tôi nghĩ cần có GUI để dân chủ hóa khả năng diễn giải mô hình và để cả game thủ cũng có thể khám phá
Tôi nghĩ Gaussian Processes với kernel phù hợp có thể rất mạnh chỉ với vài điểm dữ liệu và một bộ tham số nhỏ
Có vẻ đây là tài liệu tham khảo tốt nhất về chủ đề này và phần nào chồng lấn với nó. Có nhắc đến "An Introduction to Statistical Learning" của Gareth James và cộng sự
Kevin Murphy đang đổi tên series Probabilistic Machine Learning của ông ấy
Gemini 2.0 Experimental 02-05 xem tài liệu này chỉ là 107K token
Laplace Approximation là một cách "nhanh và đơn giản" để biến một phân bố xác suất phức tạp thành một Gaussian đơn giản (đường cong hình chuông)
Tôi đã học môn này tại ETH Zurich và đây là một trong những môn tôi thích nhất