- Erdős #281 là một bài toán giả định tình huống rằng, dù chọn vô hạn nhiều đồng dư thức như thế nào, các số nguyên không rơi vào bất kỳ đồng dư thức nào trong số đó hầu như không còn lại bao nhiêu
- Nếu tình huống này là đúng, câu hỏi đặt ra là liệu trên thực tế có thể nói rằng không cần dùng toàn bộ vô hạn đồng dư thức, mà chỉ với vài đồng dư thức đầu tiên cũng đã có thể loại bỏ gần như mọi số nguyên hay không
- Neel Somani đã sử dụng GPT-5.2 Pro để đưa ra một lời giải cho câu hỏi này, và nhiều nhà toán học đã tiến hành rà soát, bổ sung, tập trung vào các bước logic then chốt
- Thay vì tính trực tiếp từng số nguyên riêng lẻ, cách tiếp cận này xem toàn bộ tập số nguyên như một không gian duy nhất và xử lý bài toán bằng tính chất của mật độ và giới hạn
- Cũng đã xuất hiện việc chỉ ra rằng cùng một kết luận có thể được suy ra từ sự kết hợp của các định lý đã biết trước đây, kéo theo thảo luận về lý do mối liên hệ này đã không được chú ý trong thời gian dài
Erdős Problem #281 — định lý cốt lõi của cuộc thảo luận
- Erdős #281 là bài toán đặt ra dưới giả định rằng khi có vô hạn nhiều đồng dư thức được cho trước, thì dù chọn các đồng dư thức đó theo cách nào, rốt cuộc gần như mọi số nguyên đều thuộc vào ít nhất một trong số chúng
- Bối cảnh giả định rằng ta đã biết tính chất: nếu áp dụng toàn bộ các đồng dư thức thì gần như không còn số nguyên nào không thuộc đồng dư thức nào cả
- Nếu tính chất này đúng, câu hỏi được nêu ra là liệu trên thực tế có cần dùng đến vô hạn nhiều đồng dư thức đến cùng hay không, hay chỉ vài đồng dư thức đầu tiên cũng đã tạo ra hiệu ứng gần như tương tự
- Cấu trúc câu hỏi là liệu kết quả đúng ở bước vô hạn có tự động được bảo đảm cả ở bước hữu hạn hay không
- Có một khó điểm nằm ở việc liệu dưới điều kiện luôn cho phép lựa chọn lớp thặng dư theo trường hợp xấu nhất, ta vẫn có thể nói rằng chỉ cần hữu hạn đồng dư thức là đủ hay không
Cách tiếp cận trong lời giải của Neel Somani và GPT-5.2 Pro
- Thay vì xét từng số nguyên riêng lẻ, cách tiếp cận xem toàn bộ tập số nguyên như một không gian và xử lý bài toán bằng khái niệm mật độ
- Phương pháp thiết lập tập các số nguyên tránh được k đồng dư thức đầu tiên như một đối tượng để nghiên cứu
- Khi k tăng lên, tập này dần thu nhỏ lại, và cấu trúc đó được khai thác để hội tụ tới kết quả ở bước vô hạn
- Từ giả định rằng số nguyên tránh được toàn bộ vô hạn đồng dư thức là hầu như không đáng kể, lập luận phát triển theo hướng cho thấy ở bước hữu hạn tập này cũng buộc phải trở nên đủ nhỏ
- Dòng lập luận tổng thể được xây dựng bằng cách dùng giới hạn, trung bình và tính chất dịch chuyển
Quá trình thẩm định và diễn tiến thảo luận
- Trong lời giải được đưa ra, tính chính đáng của thứ tự lấy giới hạn và quá trình xử lý trung bình đã được rà soát tập trung
- Đã có ý kiến chỉ ra rằng một số bước cần thêm giải thích và bổ sung
- Nhiều nhà toán học đã công khai kiểm tra lập luận, đồng thời làm rõ ý nghĩa của từng bước theo tiến trình từng giai đoạn
- Kết quả là cấu trúc cốt lõi của chứng minh được giữ nguyên nhưng luồng lập luận được gọt giũa thành hình thức rõ ràng hơn
Liên hệ với các định lý kinh điển
- Đã xác nhận rằng cùng một kết luận cũng có thể được suy ra bằng cách kết hợp các định lý đã biết từ trước
- Đó là sự kết hợp giữa một kết quả xử lý sự hội tụ mật độ trong điều kiện vô hạn và một định lý mô tả trường hợp xấu nhất trong điều kiện hữu hạn
- Thông qua mối liên hệ này, cấu trúc cho thấy tính chất ở bước vô hạn cũng được phản ánh mạnh mẽ ở bước hữu hạn đã lộ rõ
- Từ đó, thảo luận cũng lan sang câu hỏi vì sao mối liên hệ này đã không được hệ thống hóa rõ ràng trong thời gian dài
Vì sao trường hợp này được chú ý
- Đây là một ví dụ trong đó một bài toán được nêu ra từ lâu lại được chú ý mạnh trở lại nhờ một đề xuất lời giải dựa trên AI
- Có thể xem AI không hẳn đã đơn độc đưa ra một đáp án hoàn chỉnh, mà đúng hơn là đã khơi mào cuộc thảo luận bằng một góc nhìn mới
- Trường hợp này cho thấy độ khó của bài toán có thể thay đổi đáng kể tùy theo cách ta chuyển nó sang ngôn ngữ và khuôn khổ tư duy nào
1 bình luận
Ý kiến Hacker News
Vì vậy chứng minh do LLM tạo ra đã được chuyển sang mục 2 trên wiki của Terence Tao
Thảo luận liên quan có trong bài viết trên diễn đàn erdosproblems
Điều còn lạ hơn là chứng minh ấy lại nằm trong chính bài báo của Erdős, nhưng ông vẫn để nó dưới dạng một bài toán chưa giải
Đã có lời giải từ trước mà không ai biết vì đơn giản là chẳng mấy ai quan tâm
Chỉ tìm lại tài liệu cũ rồi gọi đó là ‘tiến triển mới’ có thể là tiến bộ tưởng tượng
Phần lớn toán học thuần túy rốt cuộc tạo cảm giác như trò chơi giải đố trí tuệ
Theo phần giải thích trên wiki của Tao,
các bài toán Erdos có độ khó rất khác nhau, và một số được xếp vào nhóm bài toán độ khó thấp phù hợp để AI giải
Các bài toán dễ ở đây vẫn ở mức “ngay cả những nhà toán học giỏi nhất cũng không thể giải ngay”, nên phù hợp làm thước đo năng lực AI
Khi AI tiến bộ hơn, nó có lẽ sẽ leo dần lên chiếc thang độ khó với các bài toán ngày càng khó hơn
và thậm chí còn không biết rằng chứng minh đó đã nằm trong bài báo của chính Erdos
Thế mà Fediverse và Twitter lại ồn ào gọi đây là bước đột phá của LLM
điều gây ấn tượng là LLM đã tránh được lỗi khi hoán đổi giới hạn hoặc xử lý lượng từ
Với thế hệ mô hình trước, những chỗ như vậy có lẽ đã bị sai
Ông nói rằng đã ghi kết quả này vào mục 1 của wiki
cùng kết quả đó đã được chứng minh từ trước
Tao bình luận rằng “chứng minh mới khác với chứng minh cũ, nhưng sẽ chuyển sang mục 2”
Các mô hình mới nhất tự tin nói rằng chúng tạo ra “mã hoàn hảo 100%”, nhưng thực tế lại bị crash
Ngay cả lúc thử thanh toán z.ai cũng phát sinh lỗi nên còn chẳng mua được
LLM là công nghệ đáng kinh ngạc, nhưng đồng thời cũng là công nghệ bị thổi phồng quá mức
Cần các thực chứng như log hoặc kết quả chạy
Mô hình chỉ tạo văn bản, còn ứng dụng phải chịu trách nhiệm kiểm chứng nó
Nhưng việc tạo ra văn bản hoàn hảo hiện tại vẫn là điều bất khả thi
Vì đã thấy nhiều trường hợp LLM tự tin đưa ra đáp án sai
Chính sách bộ nhớ và giới hạn quyền truy cập mô hình của OpenAI cũng là một chủ đề thú vị
Trường hợp lần này là ChatGPT 5.2 đưa ra đáp án trong 1 giờ,
nhưng chưa rõ điều đó có lặp lại được không, vì sao nó lại đưa ra cách giải đó, và nó đã chứng minh điều gì
Việc Tao kiểm chứng tạo thêm độ tin cậy, nhưng rốt cuộc vẫn còn câu hỏi: “liệu mô hình này có được huấn luyện để hợp với toán học thuần túy hơn không?”
Xem trường hợp trước và liên kết phiên ChatGPT
Liên kết liên quan
rồi sau đó kiểm chứng bằng các hệ thống chứng minh hình thức như Lean
Tao trước tiên xem độ đúng của chứng minh, rồi sau đó dùng tra cứu tài liệu để kiểm tra tính mới
Hiện tại gần như chưa có chứng minh hoàn toàn mới, nhưng các cách tiếp cận mới đang bắt đầu xuất hiện
Trường hợp này ban đầu trông như một chứng minh mới, nhưng cuối cùng lại là kết quả mà Erdos đã biết từ trước
Sau khi đưa hai chứng minh vào Opus, nó nói đã xác nhận chúng tương đương
và nếu thiếu kiểm chứng chi tiết thì toàn bộ chứng minh có thể sụp đổ
Họ đưa ra tập (U_k) làm ví dụ để nêu khả năng phản ví dụ
Xem bình luận này để biết thêm thảo luận
Độ chính xác toán học của nó thấp hơn ChatGPT hoặc Gemini Pro
Điều đó khiến tôi tự hỏi liệu có phải một số nhà toán học chuyên nghiệp đang dùng AI nhưng không công khai hay không
Giống như cuộc đua doping trong thể thao, ai cũng sẽ dùng để không bị tụt lại
Hơn nữa việc dùng AI cũng không hề vi phạm quy tắc
nhưng LLM vẫn chưa tạo ra tiến triển thực chất
Cá nhân tôi thấy một dòng cảm ơn là phù hợp
Với tư cách postdoc toán học, tôi thấy GPT 5.2 ít bịa đặt hơn và thành thật khi thất bại
Trong khi đó Gemini 3 khi sai thì lại có xu hướng bịa ra các định lý không có thật
hay thực sự là thành quả nghiên cứu có tính nguyên bản
các bài toán Erdos có độ khó dao động rất lớn và có tồn tại một nhóm bài toán độ khó thấp mà AI dễ giải
Nếu một bài toán nằm trong danh sách Erdos thì ít nhất cũng có khả năng đã từng có ai đó thử qua một lần