- Cuốn sách này nhằm giới thiệu một cách gần gũi về mặt toán học các khái niệm cơ bản, bài toán và thuật toán của học tăng cường
- Không chỉ trình bày quy trình của các thuật toán, sách còn giải thích từ góc nhìn toán học để người đọc có thể hiểu vì sao chúng được thiết kế như vậy và vì sao chúng hiệu quả
- Mức độ chuyên sâu về toán được điều chỉnh ở mức phù hợp, đồng thời cung cấp các ví dụ để người đọc có thể lựa chọn đọc theo nhu cầu
- Tách các ý tưởng cốt lõi của thuật toán khỏi những yếu tố phức tạp để giúp người đọc hiểu rõ hơn
- Mỗi chương được xây dựng dựa trên chương trước và cung cấp nền tảng cho chương tiếp theo
Nội dung
- Cuốn sách gồm 10 chương và được chia thành hai phần về các công cụ cơ bản và các thuật toán.
- Các chương có liên hệ chặt chẽ với nhau, vì vậy cần học các chương đầu trước.
Đối tượng độc giả
- Cuốn sách dành cho sinh viên đại học năm cuối, học viên cao học, nhà nghiên cứu và người làm thực tế quan tâm đến học tăng cường.
- Sách bắt đầu từ các khái niệm cơ bản để ngay cả người không có kiến thức nền về học tăng cường cũng có thể hiểu được.
- Cần có kiến thức về lý thuyết xác suất và đại số tuyến tính; các nền tảng toán học cần thiết được đưa vào phần phụ lục.
Video bài giảng
- Có thể học hiệu quả hơn bằng cách kết hợp sách với video bài giảng.
- Video bài giảng tiếng Trung có thể xem trên kênh Bilibili và kênh YouTube, và đến tháng 2 năm 2025 đã ghi nhận hơn 1.300.000 lượt xem.
- Video bài giảng tiếng Anh đã được tải lên YouTube.
Giới thiệu tác giả
- Thông tin về tác giả có thể xem trên trang chủ và website của nhóm nghiên cứu.
- Từ năm 2019, tác giả đã giảng dạy các khóa học sau đại học về học tăng cường, và cuốn sách này được chuẩn bị từ ghi chú bài giảng.
- Tác giả hy vọng cuốn sách này sẽ giúp người đọc bước vào lĩnh vực học tăng cường một cách thuận lợi.
Trích dẫn
- Tên sách: "Mathematical Foundations of Reinforcement Learning"
- Tác giả: S. Zhao
- Năm xuất bản: 2025
- Nhà xuất bản: Springer Nature Press và Tsinghua University Press
Lịch sử cập nhật
- Tháng 2 năm 2025: đạt 5.000+ sao
- Tháng 12 năm 2024: đạt 4.000+ sao
- Tháng 10 năm 2024: hoàn tất thiết kế bìa sách
- Tháng 9 năm 2024: chỉnh sửa cuối cùng trước khi xuất bản với Springer
- Tháng 8 năm 2024: đạt 3.000+ sao và thêm mã nguồn
- Tháng 6 năm 2024: chỉnh sửa cuối cùng trước khi xuất bản
- Tháng 4 năm 2024: thêm mã cho môi trường Grid World
- Tháng 3 năm 2024: đạt 2.000 sao
- Tháng 3 năm 2024: bản nháp phiên bản thứ ba được đưa lên mạng
- Tháng 9 năm 2023: đạt 1.000+ sao
- Tháng 8 năm 2023: bản nháp phiên bản thứ hai được đưa lên mạng
- Tháng 11 năm 2022: dự kiến đồng xuất bản cùng Springer Nature và Tsinghua University Press
- Tháng 10 năm 2022: ghi chú bài giảng và video được đưa lên mạng
- Tháng 8 năm 2022: bản nháp đầu tiên được đưa lên mạng
2 bình luận
Cảm ơn bạn đã giới thiệu tài liệu hay.
Ý kiến trên Hacker News
Điểm mạnh lớn của reinforcement learning (RL) trong thời kỳ OpenAI Gym là rất dễ tiếp cận với người mới bắt đầu. Có thể học RL như một sở thích trong các môi trường nhỏ và thử áp dụng vào những bài toán đơn giản như Cartpole. Tôi tự hỏi liệu có những bài toán hay môi trường học RL tương tự, dễ tiếp cận và liên quan đến LLMs hay không. Cũng tò mò không biết với một chiếc MacBook Air thông thường thì có thể làm gì trong mảng LLM x RL
Một tài liệu tuyệt vời khác về RL là bộ giáo trình của Mykel Kochenderfer
Cuốn sách này nói rằng người đọc cần có kiến thức về lý thuyết xác suất và đại số tuyến tính. Những câu như vậy lúc nào cũng nên được tiếp nhận một cách dè dặt, cùng với việc hiểu rằng chúng thường do các mọt toán viết ra. Một lập trình viên bình thường với năng lực toán học trung bình nên cẩn trọng
Tôi không biết làm sao để từ việc hiểu tài liệu này mà kiếm được công việc trong lĩnh vực này. Hiện tại tôi vẫn đang là kỹ sư phần mềm (SWE)