- Trong quá trình giải Bài toán Erdős #367, các công cụ AI đóng vai trò then chốt, và đã xuất hiện một trường hợp cộng tác giữa nhà toán học con người với AI
- Wouter van Doorn đã đưa ra phản ví dụ do con người tạo ra cho phần thứ hai của bài toán, sau đó Gemini Deepthink tạo ra chứng minh đầy đủ cho đồng dư thức liên quan
- Terence Tao đã chuyển đổi chứng minh dựa trên lý thuyết số đại số p-adic của Gemini sang dạng đơn giản hơn để đăng tải, và sau đó nhắc đến khả năng hình thức hóa bằng Lean
- Boris Alexeev đã hoàn tất hình thức hóa bằng Lean với công cụ Aristotle của Harmonic, đồng thời tự kiểm chứng mệnh đề cuối cùng bằng tay để ngăn việc lạm dụng AI
- Chuỗi sự việc này cho thấy việc AI hỗ trợ trong nghiên cứu toán học đang dần trở thành một quy trình tiêu chuẩn
Trường hợp cộng tác AI trong Bài toán Erdős #367
- Ngày 20 tháng 11, Wouter van Doorn đã đưa ra phản ví dụ cho phần thứ hai của bài toán, và điều này phụ thuộc vào giả định rằng một đồng dư thức cụ thể là đúng
- Ông đã đề nghị những người tham gia khác xác minh tính hợp lệ của đồng dư thức đó
- Vài giờ sau, Terence Tao đã đưa bài toán này cho Gemini Deepthink, và sau khoảng 10 phút đã nhận được chứng minh đầy đủ của đồng dư thức cùng xác nhận cho toàn bộ lập luận
- Chứng minh của Gemini sử dụng lý thuyết số đại số p-adic, và Tao đã chuyển nó thành một chứng minh sơ cấp đơn giản hơn rồi đăng lên trang web
- Tao cho biết chứng minh này có thể “vibe formalizing” trong Lean
Hình thức hóa và kiểm chứng bằng Lean
- Hai ngày sau, Boris Alexeev đã hoàn tất việc hình thức hóa bằng Lean bằng công cụ Aristotle của Harmonic
- Để ngăn việc lạm dụng AI, mệnh đề cuối cùng được tự tay hình thức hóa trực tiếp
- Toàn bộ quá trình mất khoảng 2~3 giờ, và kết quả đã được công bố trực tuyến
- Sau đó Tao đã dùng AI để tìm kiếm tài liệu, nhưng dù có một số nghiên cứu liên quan, ông không tìm thấy gì liên quan trực tiếp tới bài toán #367
Phản ứng và thảo luận trong cộng đồng
- Một số người dùng theo dõi với sự thích thú qua cập nhật của Tao về tình hình ứng dụng AI trong toán học học thuật
- Một người dùng khác đưa ra quan điểm phê phán đối với cách tiếp cận hình thức chủ nghĩa của Lean, cho rằng hiểu biết toán học là nén (compression), còn Lean thì phân rã nó thành các chi tiết mức thấp (decompression)
- Tài liệu liên quan “Against Lean: Why Proof Assistants Formalize the Wrong Thing” lập luận rằng Lean và các trợ lý chứng minh tương tự đang nắm bắt sai bản chất của toán học
- Một người dùng khác nhắc đến vấn đề độ chính xác trong đối thoại với AI, đồng thời đánh giá rằng dù cần tinh chỉnh kỹ nhưng vẫn rất thú vị khi sử dụng
1 bình luận
Ý kiến trên Hacker News
Thật đáng kinh ngạc khi có thể đưa các bài báo ML thiên về toán cho trợ lý AI và nhận lại phần giải thích ngắn gọn hoặc mã giả
Với tôi, người đã hơn 25 năm không hề dùng lại những gì học ở đại học, điều này thực sự giúp ích rất nhiều
Có thể đưa bài báo vào Claude, nhận phần tổng quan rồi tiếp tục đặt câu hỏi
Ngay cả ở những lĩnh vực như sinh học mà tôi chưa từng học ở bậc cử nhân hay thạc sĩ, tôi vẫn có thể đào sâu như đang trò chuyện với một gia sư hiểu biết
Mong rằng các nhà nghiên cứu và doanh nghiệp sẽ đạt được nhiều cải thiện năng suất hơn trong nghiên cứu khoa học
Ngay cả một trợ lý chưa hoàn hảo cũng đủ để tăng đòn bẩy rất nhiều
Nghe nói đây là startup do CEO của Robin Hood sáng lập
“Vibe formalizing” tạo cảm giác như phần mở rộng hợp lý của “vibe engineering” và “vibe coding”
Khi các mảnh ghép của bài toán không khớp với nhau, cách tiếp cận kiểu “Move 37 as a Service” kết hợp phương pháp phi hình thức với tính chặt chẽ toán học khá thú vị
Tất nhiên vẫn có chỗ sai, nhưng tôi có thể phản chiếu sự bối rối của mình vào cuộc đối thoại để đào sâu hiểu biết
AI đặc biệt giỏi trong việc xác định điểm gây bối rối cho người dùng
Tôi đã nghe câu chuyện về cách phát âm tên của nhà toán học Hungary Erdős
Tiếng Hungary gần như đọc đúng theo mặt chữ, nhưng tên riêng thì có ngoại lệ
Theo kiểu tiếng Anh, nó nghe đại khái như “airdish”
Ví dụ: Görgey, Széchényi, Lánczos, v.v.
Thứ tự tên của người Hungary giống tiếng Nhật, theo kiểu họ-tên (big endian). Ví dụ: “Erdős Pál”, “Neumann János”
Điều thú vị là trong phần bình luận có phản ứng mang xu hướng anti-Lean
Không rõ đó chỉ là quảng bá cho một cách tiếp cận khác, hay là phản đối Lean về mặt triết học
Kết quả dùng AI trong toán học nghiên cứu của tôi là pha trộn cả tốt lẫn xấu
Có lúc nó tự động hoàn thiện được các lập luận không tầm thường, nhưng ở một số mảng thì lại lạc đường hoàn toàn
Tôi vẫn nghĩ hiện tại AI chỉ hữu ích như một công cụ hỗ trợ, chứ chưa thể thay thế nhà toán học
Trong lập trình cũng có lúc nó không bắt được lỗi vặt, nhưng với các tác vụ phức tạp thì lại giúp rất nhiều
Cuối cùng thì những công cụ này vẫn còn rất xa mới thay thế được chuyên gia, và việc thổi phồng quá mức có thể làm hại lòng tin
Như câu nói “nếu đã hứa mặt trăng thì phải đưa được mặt trăng”, mức kỳ vọng thực tế là điều quan trọng
Tôi không thể tin rằng trong đời mình lại được sống tới thời kỳ kiểu Star Trek nơi có thể nói “máy tính, hãy phác họa chứng minh cho bài toán này”
Ước gì “Beam me up Scotty” cũng làm được
Tối nay khi đang lái xe, tôi đã trò chuyện với ChatGPT về cấu trúc chi tiết của trình lập lịch pipeline trong LLVM và GCC
Nhờ vậy năng suất tăng lên đáng kể, và nó còn tự động sắp xếp lại các ghi chú về trình biên dịch mà tôi đang thử nghiệm
Trước đây chuyện này là điều không thể tưởng tượng nổi
Tất nhiên kết quả có thể khác nhau tùy người
Nếu đặt tên AI là Erdos, có lẽ Erdos number của tất cả chúng ta sẽ là 1
Tôi ấn tượng với việc ông ấy đã tận dụng tốt các công cụ frontier hiện có để tạo ra một môi trường nghiên cứu toán học mang tính cộng tác
Vì lý do đó, tôi vẫn nghĩ toán học là một trong số ít ngành học hiếm hoi còn tương đối miễn nhiễm với ảnh hưởng ngụy khoa học