- Một bài toán lâu đời cho rằng giá trị nhỏ nhất của Erdős sum của primitive set là 1 và tiến gần giá trị đó khi các phần tử tiến ra vô hạn, nay được chấp nhận là đã được giải bằng một lời giải do GPT-5.4 Pro tạo ra
- Lời giải là kết quả mà Liam Price nhận được chỉ với một lần prompt rồi đăng lên erdosproblems.com, sau đó nhanh chóng thu hút chú ý qua quá trình Kevin Barreto và các chuyên gia thẩm định
- Chứng minh lần này đi theo một lộ trình khác với cách tiếp cận ban đầu mà mọi người thường chọn, nổi bật ở chỗ kết hợp một công thức đã biết trong lĩnh vực liên quan vào bài toán này theo cách không ai ngờ tới
- Chứng minh gốc của ChatGPT còn rất thô nếu dùng nguyên xi, và đã được các chuyên gia chắt lọc ý chính, hiểu đúng nội dung rồi chỉnh sửa thành dạng ngắn gọn và mạch lạc hơn
- Việc một cách tiếp cận mới của LLM hiệu quả với bài toán mà ngay cả các nhà toán học danh tiếng cũng chưa giải được có thể làm thay đổi cách nhìn về cấu trúc của các số lớn và góc nhìn liên kết các bài toán tương tự
Bài toán và cách giải
- primitive set là tập hợp số nguyên mà không có số nào trong tập chia hết cho một số khác trong cùng tập
- Erdős đã định nghĩa Erdős sum được tính trên các tập như vậy, và cho rằng điểm số này giảm xuống khi các số trong tập càng lớn
- Giả thuyết rằng giá trị nhỏ nhất của nó chính xác là 1, và tiến gần giá trị đó khi các phần tử của tập tiến ra vô hạn, đã tồn tại suốt một thời gian dài
- Lời giải lần này là kết quả mà Liam Price nhận được sau khi đưa một prompt duy nhất cho GPT-5.4 Pro, rồi đăng lên erdosproblems.com
- Price không biết bối cảnh lịch sử của bài toán, và đã thử đưa các bài toán Erdős vào AI thì nhận được một lời giải thoạt nhìn có vẻ đúng
- Sau đó anh cùng Kevin Barreto rà soát, và các chuyên gia được liên hệ đã nhanh chóng chú ý đến kết quả này
- Trước đây cũng từng có tin về việc AI giải được nhiều Erdős problems, nhưng tầm quan trọng và độ khó của từng bài toán chênh lệch rất lớn nên đây là thước đo chưa hoàn hảo để đánh giá năng lực toán học, và không ít lời giải mới nhìn thì ấn tượng nhưng thực ra không mới như vẻ bề ngoài
- Kết quả lần này được nhìn nhận khác vì nó xử lý một bài toán mà các nhà toán học danh tiếng cũng chưa giải được, đồng thời dùng một phương pháp vốn không được áp dụng cho loại bài toán này
Vì sao được đánh giá khác
- Khi giải bài toán này, con người thường chọn những hướng tiếp cận ban đầu khá giống nhau, nhưng lời giải của LLM lần này lại đi vào từ một lộ trình hoàn toàn khác
- Nó lôi kéo một công thức rất quen thuộc trong một lĩnh vực toán học liên quan, nhưng là một tổ hợp áp dụng mà trước đây không ai nghĩ đến cho dạng bài này
- Terence Tao cho rằng bản thân bài toán có thể dễ hơn tưởng tượng, và có lẽ đã tồn tại một dạng mental block ở giai đoạn tiếp cận ban đầu
- Jared Lichtman cho biết chứng minh gốc của ChatGPT nếu giữ nguyên thì rất thô, và cần quá trình chuyên gia sàng lọc để hiểu nó đang thực sự muốn nói gì
- Hiện tại, Lichtman và Tao đã rút gọn và chỉnh sửa chứng minh để làm nổi bật rõ hơn trực giác cốt lõi mà LLM đưa ra
- Bước nhảy này có thể dẫn tới một cách tư duy mới về các số lớn và cấu trúc của chúng
- Tầm quan trọng dài hạn vẫn còn quá sớm để khẳng định, nhưng hiện được xem như một phương pháp củng cố trực giác rằng các bài toán tương tự thực ra có thể được gom lại trong cùng một khung nhìn
1 bình luận
Ý kiến trên Hacker News
https://archive.ph/2w4fi
Paul Erdős là một nhà toán học cực kỳ nổi tiếng và cũng khá lập dị, sống qua phần lớn thế kỷ 20
Ông có thói quen đi tìm và ghi lại những bài toán mà các nhà toán học đang vật lộn, với độ khó trải rất rộng, từ mức bài tập về nhà của sinh viên đại học hiện nay cho tới tầm Fields Medal nếu giải được
Điểm chung gắn kết các bài toán này là: một trong những bộ óc thông minh nhất 100 năm qua cũng không thể trả lời ngay lập tức
Gần đây người ta dùng LLM để thử tạo chứng minh cho các bài toán này như một dạng benchmark, và mỗi khi có model mới ra thì lại giải thêm được vài bài
Đây là bài toán mà trước đó đã có nhiều nhà toán học chuyên môn xem xét, và chứng minh đưa ra được nói là đáng ngạc nhiên, thanh nhã, thậm chí còn cho thấy những liên hệ mới
Các lần ChatGPT giải bài toán Erdős trước đây nhìn chung kém ấn tượng hơn, gần với việc lục tìm tài liệu hoặc giải các bài tương đối dễ nhưng bị bỏ quên hơn
Đọc prompt thì cũng khiến người ta tự hỏi liệu việc khuyến khích kiểu
không theo khuôn mẫu cũng đượccó góp phần vào thành công hay không[1] https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
Prompt thực tế là như này
Họ yêu cầu đừng tìm kiếm trên internet, mà hãy tạo ra một chứng minh hoặc phản chứng không tầm thường, mới mẻ và sáng tạo cho bài toán về number theory and primitive sets
Họ đòi hỏi một unconditional proof hoặc disproof hoàn chỉnh, đồng thời nhấn mạnh lại rằng kiểu khẳng định như vậy có thể cần những yếu tố không bình thường và sáng tạo
Và có dòng
Thought for 80m 17sđi kèmhttps://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
nó đưa ra rằng bound được đề xuất là đúng và hằng số 1 là sharp,
rồi tuyên bố sẽ chứng minh
w(a)= 1/alog(a)vàuniformly for every primitive A⊂[x,∞), ∑w(a)≤1+O(1/log(x))và nói rằng đây là kết luận còn mạnh hơn mức
1+o(1)được yêu cầuhttps://chatgpt.com/share/69ed8e24-15e8-83ea-96ac-784801e4a6ec
https://chatgpt.com/share/69ed83b1-3704-8322-bcf2-322aa85d7a99
Nhưng tôi không giỏi toán đến mức có thể đánh giá liệu đó có thật sự là một chứng minh đúng hay không
Tiến bộ khoa học thường xảy ra khi đem kỹ thuật X của một lĩnh vực sang áp dụng cho bài toán Y của lĩnh vực khác, và LLM dường như mạnh hơn con người ở những kết nối liên ngành kiểu này
Vì nó biết nhiều lý thuyết và cách tiếp cận hơn rất nhiều so với những gì một cá nhân có thể biết, lại cũng không phải lo trông ngu ngốc trước đồng nghiệp
Là khả năng khái quát hóa tri thức và áp dụng nó sang domain khác
Trong dạng công việc này, LLM làm tốt hơn con người rất nhiều, và có vẻ con người từ trước đến nay đôi khi đã xếp nhầm nó vào loại sáng tạo
Không thể nói là đã tạo ra đột phá ghê gớm, nhưng tôi có cảm giác đã vài lần thu được những insight đủ đáng để viết thành white paper
Bản thân quá trình thử nối các tương quan bắc qua nhiều lĩnh vực đã là một thí nghiệm LLM khá thú vị
Hồi nhỏ tôi cũng từng đọc theo kiểu nắm cả trang cùng lúc, rồi đến một lúc nào đó chuyển sang đọc theo từng từ, từng dòng, và mode đó cứ thế cố định
Hồi đại học có một thời gian tôi từng mở ra được một kiểu nhận thức sâu hơn, rộng hơn và phi tuyến hơn trong lĩnh vực toán học của mình, nhưng không rõ đó là do thuần thục bán cầu trái hay do bán cầu phải tham gia nhiều hơn
LLM chắc chắn sẽ vượt chúng ta ở kiểu tư duy tuần tự này, và vậy thì tôi tự hỏi liệu con người có nên dồn sâu hơn vào phần right-brainness còn lại hay AI rồi cũng sẽ tới đó nhanh hơn nữa
AI là cộng sự kỳ quặc mà tôi thích nhất
Một số bài toán Erdős về sau, khi dùng các kỹ thuật tinh vi được phát triển sau đó, gần như trở thành hiển nhiên
Một giáo sư của tôi từng là đồng tác giả với Erdős, và ông rất tự hào kể rằng có lúc đã có thể lấy một bài toán Erdős từng chưa được giải để ra làm câu đố cho sinh viên đại học
Vì vậy trường hợp lần này có vẻ là bằng chứng cho thấy model thực sự mạnh hơn trước
Bởi các thế hệ LLM trước đó đã không giải được bài này
Vì thế kết quả lần này càng trông đáng hy vọng hơn
Bởi giờ đã có một hướng tiếp cận mới đáng để đánh giá trên các bài toán tương tự
Đến mức này thì nên lập một GitHub repo, nhét vào đó thật nhiều bài toán dry lab chưa giải được, rồi làm một harness chạy toàn bộ mỗi khi có model mới ra
[1] https://github.com/teorth/erdosproblems
Bài viết này cũng chỉ là câu chuyện về việc một trong số đó đã được giải
Đọc câu
bản gốc chứng minh của ChatGPT thật ra khá tệ, và phải có chuyên gia sàng lọc mới hiểu nó đang muốn nói gìlàm tôi thấy đúng y hệt cảm giác khi đọc các bài báo toán họcNếu đây là một bài toán 60 năm tuổi, tôi từng nghĩ có thể thực ra nó đã được giải gián tiếp ở đâu đó rồi, và model chỉ đơn giản là lần ra bằng cách đối chiếu nhiều mẩu thông tin
Nhưng nhìn trên site thì gần như không có dấu vết con người từng bàn đến trước đây, và ngay cả các bình luận gần đây cũng chỉ nói rằng GPT đã tìm ra nó, nên tôi lại càng thấy vậy
Với một bài toán 60 năm tuổi, tôi đã tưởng sẽ có những cuộc thảo luận cũ hơn, nên cũng tò mò không biết mình đang bỏ sót điều gì
Dù sao thì đây vẫn là một phát hiện tuyệt vời, và có lẽ còn nhiều bài toán tương tự đáng để kiểm tra lại bằng GPT
Con người, và cả những cỗ máy do con người tạo ra, phần lớn đều giải bài toán theo kiểu tích lũy
Cứ tiếp tục xây chồng lên nền tảng sẵn có, nên vì không muốn phát minh lại bánh xe mà rất dễ bị mắc kẹt trong lối tư duy
Vì vậy nếu một LLM ngây thơ đưa ra cách tiếp cận mà các chuyên gia chưa thử thì tôi cũng không thấy quá ngạc nhiên
Trong những trường hợp hạn chế như thế, LLM có thể khá hữu ích với vai trò ném ra một cách tiếp cận khác, không nhất thiết phải là đáp án đúng, chỉ cần đưa ra phương án thay thế để khuấy động bàn cờ
Tuy vậy, tôi không rõ bài toán Erdős này có giá trị thực tiễn gì
Nếu hỏi đây có phải bằng chứng rằng LLM không phải đồ vô dụng không, thì nghe hơi giống như năm 1928 đi hỏi có nên đầu tư hàng triệu đô vào number theory hay không
Khi đó câu trả lời có lẽ sẽ là
không, và mời anh ra khỏi văn phòng của tôi