1 điểm bởi GN⁺ 5 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Một bài toán lâu đời cho rằng giá trị nhỏ nhất của Erdős sum của primitive set là 1 và tiến gần giá trị đó khi các phần tử tiến ra vô hạn, nay được chấp nhận là đã được giải bằng một lời giải do GPT-5.4 Pro tạo ra
  • Lời giải là kết quả mà Liam Price nhận được chỉ với một lần prompt rồi đăng lên erdosproblems.com, sau đó nhanh chóng thu hút chú ý qua quá trình Kevin Barreto và các chuyên gia thẩm định
  • Chứng minh lần này đi theo một lộ trình khác với cách tiếp cận ban đầu mà mọi người thường chọn, nổi bật ở chỗ kết hợp một công thức đã biết trong lĩnh vực liên quan vào bài toán này theo cách không ai ngờ tới
  • Chứng minh gốc của ChatGPT còn rất thô nếu dùng nguyên xi, và đã được các chuyên gia chắt lọc ý chính, hiểu đúng nội dung rồi chỉnh sửa thành dạng ngắn gọn và mạch lạc hơn
  • Việc một cách tiếp cận mới của LLM hiệu quả với bài toán mà ngay cả các nhà toán học danh tiếng cũng chưa giải được có thể làm thay đổi cách nhìn về cấu trúc của các số lớn và góc nhìn liên kết các bài toán tương tự

Bài toán và cách giải

  • primitive set là tập hợp số nguyên mà không có số nào trong tập chia hết cho một số khác trong cùng tập
    • Erdős đã định nghĩa Erdős sum được tính trên các tập như vậy, và cho rằng điểm số này giảm xuống khi các số trong tập càng lớn
    • Giả thuyết rằng giá trị nhỏ nhất của nó chính xác là 1, và tiến gần giá trị đó khi các phần tử của tập tiến ra vô hạn, đã tồn tại suốt một thời gian dài
  • Lời giải lần này là kết quả mà Liam Price nhận được sau khi đưa một prompt duy nhất cho GPT-5.4 Pro, rồi đăng lên erdosproblems.com
    • Price không biết bối cảnh lịch sử của bài toán, và đã thử đưa các bài toán Erdős vào AI thì nhận được một lời giải thoạt nhìn có vẻ đúng
    • Sau đó anh cùng Kevin Barreto rà soát, và các chuyên gia được liên hệ đã nhanh chóng chú ý đến kết quả này
  • Trước đây cũng từng có tin về việc AI giải được nhiều Erdős problems, nhưng tầm quan trọng và độ khó của từng bài toán chênh lệch rất lớn nên đây là thước đo chưa hoàn hảo để đánh giá năng lực toán học, và không ít lời giải mới nhìn thì ấn tượng nhưng thực ra không mới như vẻ bề ngoài
    • Kết quả lần này được nhìn nhận khác vì nó xử lý một bài toán mà các nhà toán học danh tiếng cũng chưa giải được, đồng thời dùng một phương pháp vốn không được áp dụng cho loại bài toán này

Vì sao được đánh giá khác

  • Khi giải bài toán này, con người thường chọn những hướng tiếp cận ban đầu khá giống nhau, nhưng lời giải của LLM lần này lại đi vào từ một lộ trình hoàn toàn khác
    • Nó lôi kéo một công thức rất quen thuộc trong một lĩnh vực toán học liên quan, nhưng là một tổ hợp áp dụng mà trước đây không ai nghĩ đến cho dạng bài này
  • Terence Tao cho rằng bản thân bài toán có thể dễ hơn tưởng tượng, và có lẽ đã tồn tại một dạng mental block ở giai đoạn tiếp cận ban đầu
  • Jared Lichtman cho biết chứng minh gốc của ChatGPT nếu giữ nguyên thì rất thô, và cần quá trình chuyên gia sàng lọc để hiểu nó đang thực sự muốn nói gì
    • Hiện tại, Lichtman và Tao đã rút gọn và chỉnh sửa chứng minh để làm nổi bật rõ hơn trực giác cốt lõi mà LLM đưa ra
  • Bước nhảy này có thể dẫn tới một cách tư duy mới về các số lớn và cấu trúc của chúng
    • Tầm quan trọng dài hạn vẫn còn quá sớm để khẳng định, nhưng hiện được xem như một phương pháp củng cố trực giác rằng các bài toán tương tự thực ra có thể được gom lại trong cùng một khung nhìn

1 bình luận

 
Ý kiến trên Hacker News
  • https://archive.ph/2w4fi

  • Paul Erdős là một nhà toán học cực kỳ nổi tiếng và cũng khá lập dị, sống qua phần lớn thế kỷ 20
    Ông có thói quen đi tìm và ghi lại những bài toán mà các nhà toán học đang vật lộn, với độ khó trải rất rộng, từ mức bài tập về nhà của sinh viên đại học hiện nay cho tới tầm Fields Medal nếu giải được
    Điểm chung gắn kết các bài toán này là: một trong những bộ óc thông minh nhất 100 năm qua cũng không thể trả lời ngay lập tức
    Gần đây người ta dùng LLM để thử tạo chứng minh cho các bài toán này như một dạng benchmark, và mỗi khi có model mới ra thì lại giải thêm được vài bài

    • Nhìn phản ứng của giới toán học, lần chứng minh Erdős này có vẻ là một cột mốc khá đặc biệt
      Đây là bài toán mà trước đó đã có nhiều nhà toán học chuyên môn xem xét, và chứng minh đưa ra được nói là đáng ngạc nhiên, thanh nhã, thậm chí còn cho thấy những liên hệ mới
      Các lần ChatGPT giải bài toán Erdős trước đây nhìn chung kém ấn tượng hơn, gần với việc lục tìm tài liệu hoặc giải các bài tương đối dễ nhưng bị bỏ quên hơn
      Đọc prompt thì cũng khiến người ta tự hỏi liệu việc khuyến khích kiểu không theo khuôn mẫu cũng được có góp phần vào thành công hay không
      [1] https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
    • Bài báo đang nói về trường hợp giải một bài toán chưa được giải quyết từ trước, nên đương nhiên thuộc nhóm khó hơn
  • Prompt thực tế là như này
    Họ yêu cầu đừng tìm kiếm trên internet, mà hãy tạo ra một chứng minh hoặc phản chứng không tầm thường, mới mẻ và sáng tạo cho bài toán về number theory and primitive sets
    Họ đòi hỏi một unconditional proof hoặc disproof hoàn chỉnh, đồng thời nhấn mạnh lại rằng kiểu khẳng định như vậy có thể cần những yếu tố không bình thường và sáng tạo
    Và có dòng Thought for 80m 17s đi kèm
    https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c

    • Khi chạy bằng 5.5 Pro, Extended Thinking, chỉ trong 17 phút,
      nó đưa ra rằng bound được đề xuất là đúng và hằng số 1 là sharp,
      rồi tuyên bố sẽ chứng minh w(a)= 1/alog(a)uniformly for every primitive A⊂[x,∞), ∑w(a)≤1+O(1/log(x))
      và nói rằng đây là kết luận còn mạnh hơn mức 1+o(1) được yêu cầu
      https://chatgpt.com/share/69ed8e24-15e8-83ea-96ac-784801e4a6ec
    • Trường hợp của tôi thì mất 20 phút với Pro
      https://chatgpt.com/share/69ed83b1-3704-8322-bcf2-322aa85d7a99
      Nhưng tôi không giỏi toán đến mức có thể đánh giá liệu đó có thật sự là một chứng minh đúng hay không
    • Tôi cũng thử cùng prompt đó với free plan, và kết quả kém hơn rất nhiều
  • Tiến bộ khoa học thường xảy ra khi đem kỹ thuật X của một lĩnh vực sang áp dụng cho bài toán Y của lĩnh vực khác, và LLM dường như mạnh hơn con người ở những kết nối liên ngành kiểu này
    Vì nó biết nhiều lý thuyết và cách tiếp cận hơn rất nhiều so với những gì một cá nhân có thể biết, lại cũng không phải lo trông ngu ngốc trước đồng nghiệp

    • Theo tôi, đó cũng chính là reasoning
      Là khả năng khái quát hóa tri thức và áp dụng nó sang domain khác
    • Phần lớn lao động trí óc thực ra gần với intellectual labor hơn, tức là công việc kết hợp nhiều mẩu thông tin ở một chỗ
      Trong dạng công việc này, LLM làm tốt hơn con người rất nhiều, và có vẻ con người từ trước đến nay đôi khi đã xếp nhầm nó vào loại sáng tạo
    • Thực ra tôi cũng đang dùng theo kiểu đó
      Không thể nói là đã tạo ra đột phá ghê gớm, nhưng tôi có cảm giác đã vài lần thu được những insight đủ đáng để viết thành white paper
      Bản thân quá trình thử nối các tương quan bắc qua nhiều lĩnh vực đã là một thí nghiệm LLM khá thú vị
    • Nền văn minh đã được thúc đẩy mạnh bởi lối left-brained/sequential/language based, và máy tính cùng AI có vẻ là đỉnh cao của xu hướng đó
      Hồi nhỏ tôi cũng từng đọc theo kiểu nắm cả trang cùng lúc, rồi đến một lúc nào đó chuyển sang đọc theo từng từ, từng dòng, và mode đó cứ thế cố định
      Hồi đại học có một thời gian tôi từng mở ra được một kiểu nhận thức sâu hơn, rộng hơn và phi tuyến hơn trong lĩnh vực toán học của mình, nhưng không rõ đó là do thuần thục bán cầu trái hay do bán cầu phải tham gia nhiều hơn
      LLM chắc chắn sẽ vượt chúng ta ở kiểu tư duy tuần tự này, và vậy thì tôi tự hỏi liệu con người có nên dồn sâu hơn vào phần right-brainness còn lại hay AI rồi cũng sẽ tới đó nhanh hơn nữa
    • Muốn xem một ví dụ tiêu biểu về việc đem kỹ thuật của lĩnh vực này áp sang lĩnh vực khác thì hãy tìm Langlands project
  • AI là cộng sự kỳ quặc mà tôi thích nhất

  • Một số bài toán Erdős về sau, khi dùng các kỹ thuật tinh vi được phát triển sau đó, gần như trở thành hiển nhiên
    Một giáo sư của tôi từng là đồng tác giả với Erdős, và ông rất tự hào kể rằng có lúc đã có thể lấy một bài toán Erdős từng chưa được giải để ra làm câu đố cho sinh viên đại học

    • Nói thêm một ý ở đây là những bài toán đó thực ra đã gần như được đem chạy qua LLM hết rồi
      Vì vậy trường hợp lần này có vẻ là bằng chứng cho thấy model thực sự mạnh hơn trước
      Bởi các thế hệ LLM trước đó đã không giải được bài này
    • Theo Tao, cách tiếp cận kinh điển sẵn có cho bài toán này vừa có vẻ là ngõ cụt, nhưng đồng thời lại quá hiển nhiên nên ai cũng sẽ thử nó trước tiên
      Vì thế kết quả lần này càng trông đáng hy vọng hơn
      Bởi giờ đã có một hướng tiếp cận mới đáng để đánh giá trên các bài toán tương tự
  • Đến mức này thì nên lập một GitHub repo, nhét vào đó thật nhiều bài toán dry lab chưa giải được, rồi làm một harness chạy toàn bộ mỗi khi có model mới ra

    • Thực ra Terence Tao cùng các nhà toán học khác đang vận hành một kho như vậy, và actively dùng nó để tìm lời giải bằng LLM
      [1] https://github.com/teorth/erdosproblems
    • Nó đúng theo nghĩa đen chính là các Erdős problems
      Bài viết này cũng chỉ là câu chuyện về việc một trong số đó đã được giải
  • Đọc câu bản gốc chứng minh của ChatGPT thật ra khá tệ, và phải có chuyên gia sàng lọc mới hiểu nó đang muốn nói gì làm tôi thấy đúng y hệt cảm giác khi đọc các bài báo toán học

  • Nếu đây là một bài toán 60 năm tuổi, tôi từng nghĩ có thể thực ra nó đã được giải gián tiếp ở đâu đó rồi, và model chỉ đơn giản là lần ra bằng cách đối chiếu nhiều mẩu thông tin
    Nhưng nhìn trên site thì gần như không có dấu vết con người từng bàn đến trước đây, và ngay cả các bình luận gần đây cũng chỉ nói rằng GPT đã tìm ra nó, nên tôi lại càng thấy vậy
    Với một bài toán 60 năm tuổi, tôi đã tưởng sẽ có những cuộc thảo luận cũ hơn, nên cũng tò mò không biết mình đang bỏ sót điều gì
    Dù sao thì đây vẫn là một phát hiện tuyệt vời, và có lẽ còn nhiều bài toán tương tự đáng để kiểm tra lại bằng GPT

  • Con người, và cả những cỗ máy do con người tạo ra, phần lớn đều giải bài toán theo kiểu tích lũy
    Cứ tiếp tục xây chồng lên nền tảng sẵn có, nên vì không muốn phát minh lại bánh xe mà rất dễ bị mắc kẹt trong lối tư duy
    Vì vậy nếu một LLM ngây thơ đưa ra cách tiếp cận mà các chuyên gia chưa thử thì tôi cũng không thấy quá ngạc nhiên
    Trong những trường hợp hạn chế như thế, LLM có thể khá hữu ích với vai trò ném ra một cách tiếp cận khác, không nhất thiết phải là đáp án đúng, chỉ cần đưa ra phương án thay thế để khuấy động bàn cờ
    Tuy vậy, tôi không rõ bài toán Erdős này có giá trị thực tiễn gì
    Nếu hỏi đây có phải bằng chứng rằng LLM không phải đồ vô dụng không, thì nghe hơi giống như năm 1928 đi hỏi có nên đầu tư hàng triệu đô vào number theory hay không
    Khi đó câu trả lời có lẽ sẽ là không, và mời anh ra khỏi văn phòng của tôi