Erdos 281 được giải bằng ChatGPT 5.2 Pro

(twitter.com/neelsomani)

1 điểm bởi GN⁺ 2026-01-19 | 1 bình luận | Chia sẻ qua WhatsApp

Erdős #281 là một bài toán giả định tình huống rằng, dù chọn vô hạn nhiều đồng dư thức như thế nào, các số nguyên không rơi vào bất kỳ đồng dư thức nào trong số đó hầu như không còn lại bao nhiêu
Nếu tình huống này là đúng, câu hỏi đặt ra là liệu trên thực tế có thể nói rằng không cần dùng toàn bộ vô hạn đồng dư thức, mà chỉ với vài đồng dư thức đầu tiên cũng đã có thể loại bỏ gần như mọi số nguyên hay không
Neel Somani đã sử dụng GPT-5.2 Pro để đưa ra một lời giải cho câu hỏi này, và nhiều nhà toán học đã tiến hành rà soát, bổ sung, tập trung vào các bước logic then chốt
Thay vì tính trực tiếp từng số nguyên riêng lẻ, cách tiếp cận này xem toàn bộ tập số nguyên như một không gian duy nhất và xử lý bài toán bằng tính chất của mật độ và giới hạn
Cũng đã xuất hiện việc chỉ ra rằng cùng một kết luận có thể được suy ra từ sự kết hợp của các định lý đã biết trước đây, kéo theo thảo luận về lý do mối liên hệ này đã không được chú ý trong thời gian dài

Erdős Problem #281 — định lý cốt lõi của cuộc thảo luận

Erdős #281 là bài toán đặt ra dưới giả định rằng khi có vô hạn nhiều đồng dư thức được cho trước, thì dù chọn các đồng dư thức đó theo cách nào, rốt cuộc gần như mọi số nguyên đều thuộc vào ít nhất một trong số chúng
Bối cảnh giả định rằng ta đã biết tính chất: nếu áp dụng toàn bộ các đồng dư thức thì gần như không còn số nguyên nào không thuộc đồng dư thức nào cả
Nếu tính chất này đúng, câu hỏi được nêu ra là liệu trên thực tế có cần dùng đến vô hạn nhiều đồng dư thức đến cùng hay không, hay chỉ vài đồng dư thức đầu tiên cũng đã tạo ra hiệu ứng gần như tương tự
Cấu trúc câu hỏi là liệu kết quả đúng ở bước vô hạn có tự động được bảo đảm cả ở bước hữu hạn hay không
Có một khó điểm nằm ở việc liệu dưới điều kiện luôn cho phép lựa chọn lớp thặng dư theo trường hợp xấu nhất, ta vẫn có thể nói rằng chỉ cần hữu hạn đồng dư thức là đủ hay không

Cách tiếp cận trong lời giải của Neel Somani và GPT-5.2 Pro

Thay vì xét từng số nguyên riêng lẻ, cách tiếp cận xem toàn bộ tập số nguyên như một không gian và xử lý bài toán bằng khái niệm mật độ
Phương pháp thiết lập tập các số nguyên tránh được k đồng dư thức đầu tiên như một đối tượng để nghiên cứu
Khi k tăng lên, tập này dần thu nhỏ lại, và cấu trúc đó được khai thác để hội tụ tới kết quả ở bước vô hạn
Từ giả định rằng số nguyên tránh được toàn bộ vô hạn đồng dư thức là hầu như không đáng kể, lập luận phát triển theo hướng cho thấy ở bước hữu hạn tập này cũng buộc phải trở nên đủ nhỏ
Dòng lập luận tổng thể được xây dựng bằng cách dùng giới hạn, trung bình và tính chất dịch chuyển

Quá trình thẩm định và diễn tiến thảo luận

Trong lời giải được đưa ra, tính chính đáng của thứ tự lấy giới hạn và quá trình xử lý trung bình đã được rà soát tập trung
Đã có ý kiến chỉ ra rằng một số bước cần thêm giải thích và bổ sung
Nhiều nhà toán học đã công khai kiểm tra lập luận, đồng thời làm rõ ý nghĩa của từng bước theo tiến trình từng giai đoạn
Kết quả là cấu trúc cốt lõi của chứng minh được giữ nguyên nhưng luồng lập luận được gọt giũa thành hình thức rõ ràng hơn

Liên hệ với các định lý kinh điển

Đã xác nhận rằng cùng một kết luận cũng có thể được suy ra bằng cách kết hợp các định lý đã biết từ trước
Đó là sự kết hợp giữa một kết quả xử lý sự hội tụ mật độ trong điều kiện vô hạn và một định lý mô tả trường hợp xấu nhất trong điều kiện hữu hạn
Thông qua mối liên hệ này, cấu trúc cho thấy tính chất ở bước vô hạn cũng được phản ánh mạnh mẽ ở bước hữu hạn đã lộ rõ
Từ đó, thảo luận cũng lan sang câu hỏi vì sao mối liên hệ này đã không được hệ thống hóa rõ ràng trong thời gian dài

Vì sao trường hợp này được chú ý

Đây là một ví dụ trong đó một bài toán được nêu ra từ lâu lại được chú ý mạnh trở lại nhờ một đề xuất lời giải dựa trên AI
Có thể xem AI không hẳn đã đơn độc đưa ra một đáp án hoàn chỉnh, mà đúng hơn là đã khơi mào cuộc thảo luận bằng một góc nhìn mới
Trường hợp này cho thấy độ khó của bài toán có thể thay đổi đáng kể tùy theo cách ta chuyển nó sang ngôn ngữ và khuôn khổ tư duy nào

1 bình luận

GN⁺ 2026-01-19

Ý kiến Hacker News

Trước đây người ta nói là chưa có lời giải, nhưng giờ đã tìm thấy lời giải có sẵn từ trước
Vì vậy chứng minh do LLM tạo ra đã được chuyển sang mục 2 trên wiki của Terence Tao
Thảo luận liên quan có trong bài viết trên diễn đàn erdosproblems
- Điều Tao nói khá thú vị — ông cho biết chứng minh mới khá khác với chứng minh trong tài liệu trước đó
  Điều còn lạ hơn là chứng minh ấy lại nằm trong chính bài báo của Erdős, nhưng ông vẫn để nó dưới dạng một bài toán chưa giải
- Có vẻ các mô hình kiểu này hoạt động như một công cụ tìm kiếm ngôn ngữ tự nhiên nối các điểm kiến thức mà con người chưa liên kết được
- Thực ra trường hợp này cho thấy bản thân bài toán không quá quan trọng
  Đã có lời giải từ trước mà không ai biết vì đơn giản là chẳng mấy ai quan tâm
  Chỉ tìm lại tài liệu cũ rồi gọi đó là ‘tiến triển mới’ có thể là tiến bộ tưởng tượng
  Phần lớn toán học thuần túy rốt cuộc tạo cảm giác như trò chơi giải đố trí tuệ
Tôi tò mò về bản chất của các bài toán Erdos — liệu đó là những bài toán khó mà các nhà toán học vật lộn nhiều năm, hay chỉ là những bài toán bị bỏ quên
Theo phần giải thích trên wiki của Tao,
các bài toán Erdos có độ khó rất khác nhau, và một số được xếp vào nhóm bài toán độ khó thấp phù hợp để AI giải
- Erdos là một nhà toán học có năng suất phi thường và rất thích đưa ra các bài toán treo thưởng
  Các bài toán dễ ở đây vẫn ở mức “ngay cả những nhà toán học giỏi nhất cũng không thể giải ngay”, nên phù hợp làm thước đo năng lực AI
  Khi AI tiến bộ hơn, nó có lẽ sẽ leo dần lên chiếc thang độ khó với các bài toán ngày càng khó hơn
- Không cần quá lo. Cả Tao lẫn tác giả đều không mấy quan tâm đến các bài toán Erdos,
  và thậm chí còn không biết rằng chứng minh đó đã nằm trong bài báo của chính Erdos
  Thế mà Fediverse và Twitter lại ồn ào gọi đây là bước đột phá của LLM
Theo bình luận mà Tao trực tiếp để lại trên diễn đàn,
điều gây ấn tượng là LLM đã tránh được lỗi khi hoán đổi giới hạn hoặc xử lý lượng từ
Với thế hệ mô hình trước, những chỗ như vậy có lẽ đã bị sai
Ông nói rằng đã ghi kết quả này vào mục 1 của wiki
- Sau đó có người rà lại tài liệu kỹ hơn và phát hiện trong bài báo năm 1936 của Davenport và Erdos,
  cùng kết quả đó đã được chứng minh từ trước
  Tao bình luận rằng “chứng minh mới khác với chứng minh cũ, nhưng sẽ chuyển sang mục 2”
Tôi chỉ mong AI trước hết chứng minh được các khẳng định của chính nó
Các mô hình mới nhất tự tin nói rằng chúng tạo ra “mã hoàn hảo 100%”, nhưng thực tế lại bị crash
Ngay cả lúc thử thanh toán z.ai cũng phát sinh lỗi nên còn chẳng mua được
LLM là công nghệ đáng kinh ngạc, nhưng đồng thời cũng là công nghệ bị thổi phồng quá mức
- Muốn xác minh mã do AI tạo ra thì cũng phải chứng minh bằng kiểm thử hoặc bằng chứng như với con người
  Cần các thực chứng như log hoặc kết quả chạy
- Cần phân biệt mô hình với ứng dụng
  Mô hình chỉ tạo văn bản, còn ứng dụng phải chịu trách nhiệm kiểm chứng nó
  Nhưng việc tạo ra văn bản hoàn hảo hiện tại vẫn là điều bất khả thi
Có chuỗi thảo luận trên diễn đàn erdosproblems mà chính Tao đã trực tiếp tham gia
Tôi thắc mắc liệu chứng minh này có thực sự được kiểm chứng hay chưa
Vì đã thấy nhiều trường hợp LLM tự tin đưa ra đáp án sai
Chính sách bộ nhớ và giới hạn quyền truy cập mô hình của OpenAI cũng là một chủ đề thú vị
- Tao đã trực tiếp phê duyệt. Có lẽ khó có sự xác minh nào chắc chắn hơn thế
Gần đây có bài viết nói Aristotle của Harmonic đã giải bài toán Erdős 728
Trường hợp lần này là ChatGPT 5.2 đưa ra đáp án trong 1 giờ,
nhưng chưa rõ điều đó có lặp lại được không, vì sao nó lại đưa ra cách giải đó, và nó đã chứng minh điều gì
Việc Tao kiểm chứng tạo thêm độ tin cậy, nhưng rốt cuộc vẫn còn câu hỏi: “liệu mô hình này có được huấn luyện để hợp với toán học thuần túy hơn không?”
Xem trường hợp trước và liên kết phiên ChatGPT
- Cách đây 49 ngày cũng có một trường hợp bài toán #124 được AI chứng minh
  Liên kết liên quan
- Đây là một trong chuỗi nỗ lực để LLM tạo ra các chứng minh ứng viên cho bài toán toán học,
  rồi sau đó kiểm chứng bằng các hệ thống chứng minh hình thức như Lean
  Tao trước tiên xem độ đúng của chứng minh, rồi sau đó dùng tra cứu tài liệu để kiểm tra tính mới
  Hiện tại gần như chưa có chứng minh hoàn toàn mới, nhưng các cách tiếp cận mới đang bắt đầu xuất hiện
  Trường hợp này ban đầu trông như một chứng minh mới, nhưng cuối cùng lại là kết quả mà Erdos đã biết từ trước
Tôi đưa cùng một prompt cho Deepseek thì nó giải nhanh hơn ChatGPT rất nhiều
Sau khi đưa hai chứng minh vào Opus, nó nói đã xác nhận chúng tương đương
- Nhưng cũng có ý kiến rằng “như thế chẳng khác nào tự mình đóng dấu xác nhận”,
  và nếu thiếu kiểm chứng chi tiết thì toàn bộ chứng minh có thể sụp đổ
- Về mặt toán học, có người nghi ngờ liệu phần mật độ của giao có đủ hay không
  Họ đưa ra tập (U_k) làm ví dụ để nêu khả năng phản ví dụ
- Khối suy luận của Kimi-k2 cũng được chia sẻ
- Cũng có ý kiến thắc mắc liệu Deepseek có ghi nhớ lời giải có sẵn hay không
  Xem bình luận này để biết thêm thảo luận
- Cũng có quan điểm cho rằng Opus không phù hợp với toán học
  Độ chính xác toán học của nó thấp hơn ChatGPT hoặc Gemini Pro
Điều đáng ngạc nhiên là phần lớn các chứng minh do LLM tạo ra lại đến từ người không chuyên
Điều đó khiến tôi tự hỏi liệu có phải một số nhà toán học chuyên nghiệp đang dùng AI nhưng không công khai hay không
- Thực ra có vẻ đa số chuyên gia đều cảm thấy “LLM khá ngớ ngẩn trong lĩnh vực chuyên môn của tôi”
- Kiểu dùng AI trong âm thầm này có lẽ sẽ sớm trở nên phổ biến
  Giống như cuộc đua doping trong thể thao, ai cũng sẽ dùng để không bị tụt lại
  Hơn nữa việc dùng AI cũng không hề vi phạm quy tắc
- Một khả năng thực tế hơn là các chuyên gia đã thử rồi,
  nhưng LLM vẫn chưa tạo ra tiến triển thực chất
- Mọi người cũng đang nghĩ về cách ghi nhận đóng góp của AI
  Cá nhân tôi thấy một dòng cảm ơn là phù hợp
  Với tư cách postdoc toán học, tôi thấy GPT 5.2 ít bịa đặt hơn và thành thật khi thất bại
  Trong khi đó Gemini 3 khi sai thì lại có xu hướng bịa ra các định lý không có thật
Tôi tò mò liệu các bài toán Erdos mà LLM giải được chỉ đơn thuần là những bài toán dễ mà con người chưa đụng tới,
hay thực sự là thành quả nghiên cứu có tính nguyên bản
- Theo lưu ý cảnh báo trên wiki của Tao,
  các bài toán Erdos có độ khó dao động rất lớn và có tồn tại một nhóm bài toán độ khó thấp mà AI dễ giải
- Dù vậy, việc LLM sắp xếp và xử lý các bài toán độ khó thấp như vậy vẫn có giá trị
  Nếu một bài toán nằm trong danh sách Erdos thì ít nhất cũng có khả năng đã từng có ai đó thử qua một lần

Erdos 281 được giải bằng ChatGPT 5.2 Pro

Erdős Problem #281 — định lý cốt lõi của cuộc thảo luận

Cách tiếp cận trong lời giải của Neel Somani và GPT-5.2 Pro

Quá trình thẩm định và diễn tiến thảo luận

Liên hệ với các định lý kinh điển

Vì sao trường hợp này được chú ý

Bài viết liên quan

1 bình luận

Ý kiến Hacker News