FunSearch: Tận dụng mô hình ngôn ngữ lớn để tạo ra những khám phá mới trong toán học và khoa học
- Mô hình ngôn ngữ lớn (LLM) có khả năng vượt trội trong việc kết hợp các khái niệm và là công cụ hữu ích hỗ trợ giải quyết vấn đề thông qua đọc, viết và lập trình.
- Do LLM đôi khi có xu hướng "ảo giác" và tạo ra thông tin không đúng sự thật, nên việc tạo ra các khám phá chính xác có thể kiểm chứng là một thách thức.
- FunSearch là phương pháp khám phá các lời giải mới trong toán học và khoa học máy tính bằng cách kết hợp một LLM đã được tiền huấn luyện có khả năng đưa ra lời giải sáng tạo với một "bộ đánh giá" tự động để lọc bỏ các ý tưởng sai.
Thúc đẩy khám phá bằng tiến hóa thông qua mô hình ngôn ngữ
- FunSearch sử dụng một phương pháp tiến hóa để phát triển các ý tưởng đạt điểm cao nhất, trong đó các ý tưởng này được biểu diễn dưới dạng chương trình máy tính có thể tự động chạy và đánh giá.
- Người dùng mô tả bài toán dưới dạng mã, bao gồm quy trình đánh giá chương trình và một chương trình hạt giống để khởi tạo tập chương trình ban đầu.
- FunSearch là một quy trình lặp, trong đó ở mỗi vòng lặp, một số chương trình trong tập hiện tại được chọn và cung cấp cho LLM, sau đó LLM tạo ra chương trình mới để đánh giá.
Mở ra hướng đi mới trong toán học
- FunSearch đã tìm ra lời giải mới cho bài toán cap set, một vấn đề đã làm đau đầu các nhà toán học suốt hàng chục năm.
- Bài toán cap set là tìm tập điểm lớn nhất trong lưới nhiều chiều sao cho không có ba điểm nào nằm trên cùng một đường thẳng, và đây là một mô hình quan trọng trong tổ hợp cực trị.
- Trong một số thiết lập, FunSearch đã tìm ra những cap set lớn nhất được phát hiện trong 20 năm qua.
FunSearch ưu tiên các chương trình ngắn gọn và con người có thể diễn giải được
- FunSearch không chỉ tạo ra lời giải cho bài toán mà còn tạo ra các chương trình giải thích cách lời giải đó được suy ra.
- FunSearch ưu tiên tìm lời giải thông qua các chương trình có độ phức tạp Kolmogorov thấp, tức là rất ngắn gọn.
- Đầu ra chương trình của FunSearch dễ để các nhà nghiên cứu hiểu và mang lại những insight có thể áp dụng được.
Giải quyết những thách thức nổi tiếng là cực kỳ khó trong điện toán
- Sau khi thành công với bài toán cap set mang tính lý thuyết, FunSearch đã được áp dụng cho bài toán "bin packing", một thách thức thực tiễn quan trọng trong khoa học máy tính.
- FunSearch đã thành công trong việc đóng gói cùng số lượng vật phẩm vào ít thùng hơn so với các heuristic hiện có.
Mở đường cho những khám phá do LLM dẫn dắt trong khoa học và xa hơn nữa
- Nếu có thể ngăn chặn hiện tượng ảo giác của LLM, chúng ta không chỉ có thể tận dụng sức mạnh của các mô hình này để tạo ra những khám phá toán học mới mà còn có thể hé lộ các lời giải có tác động lớn cho những vấn đề thực tế quan trọng.
- Nhiều khả năng việc sử dụng cách tiếp cận do LLM dẫn dắt để tạo ra các thuật toán hiệu quả và được tùy chỉnh cho nhiều bài toán khoa học và công nghiệp sẽ trở thành thông lệ phổ biến.
Ý kiến của GN⁺
- FunSearch cho thấy những khả năng mới của trí tuệ nhân tạo trong việc giải quyết các bài toán toán học. Đặc biệt, bằng cách đưa ra lời giải mới cho những vấn đề lâu nay chưa được giải quyết như bài toán cap set, vai trò của AI trong lĩnh vực toán học sẽ ngày càng trở nên quan trọng.
- Việc công nghệ này được áp dụng cho các vấn đề công nghiệp thực tế, chẳng hạn như nâng cao hiệu quả của trung tâm dữ liệu, cho thấy AI cũng có thể đóng góp vào việc giải quyết các bài toán thực tiễn.
- Các chương trình do FunSearch tạo ra có thể được con người diễn giải, điều này giúp các nhà nghiên cứu có được insight sâu hơn và hỗ trợ họ giải quyết vấn đề bằng cách hợp tác với AI.
1 bình luận
Ý kiến Hacker News
Câu hỏi về sự cần thiết của LLM:
Bối cảnh quan trọng về khám phá trong tổ hợp:
Bình luận liên quan về "tự đối đầu":
Trải nghiệm sử dụng cá nhân với tìm kiếm web:
Bài đăng Twitter về khám phá của DeepMind:
Tóm tắt bài đăng Twitter:
Tóm tắt về việc tạo chương trình:
Cách tiếp cận với bài toán cap set:
Bày tỏ sự tò mò về khả năng tích hợp giữa LLM và symbolic reasoning.
Bất kể việc có thực sự tạo ra tri thức mới hay không, đây vẫn là một case study thú vị khi xem xét việc hạn chế quyền tiếp cận AI dựa trên kích thước mô hình hoặc các biện pháp quản lý khác.
Liên hệ với định lý xấp xỉ phổ quát, có nhắc rằng mạng nơ-ron nhân tạo dùng ReLU có thể xấp xỉ chính xác một hàm.