ARC-AGI là gì?
- ARC-AGI là một bộ benchmark trí tuệ nhân tạo được giới thiệu vào năm 2019, được thiết kế để kiểm tra khả năng của hệ thống trong việc suy ra và khái quát hóa các quy tắc trừu tượng từ số lượng ví dụ tối thiểu.
- Bộ dữ liệu gồm các câu đố tương tự bài kiểm tra IQ, trong đó mỗi câu đố cung cấp nhiều hình ảnh ví dụ thể hiện quy tắc cơ bản và một hình ảnh kiểm tra nơi phải áp dụng quy tắc đó.
- Mục tiêu của việc giải ARC-AGI là làm sáng tỏ những thách thức hiện tại đang cản trở sự phát triển của trí tuệ nhân tạo.
Phương pháp giải pháp của chúng tôi
- Chúng tôi đề xuất rằng nén thông tin không mất dữ liệu có thể là một khung làm việc hiệu quả để giải các câu đố ARC-AGI.
- Việc nén câu đố hiệu quả hơn có tương quan với lời giải chính xác hơn.
- CompressARC sử dụng mạng nơ-ron làm bộ giải mã, và thuật toán mã hóa không dùng một mạng khác mà tối ưu hóa các tham số của bộ giải mã và phân phối đầu vào để thu được biểu diễn câu đố được nén tối đa.
Quan sát về quá trình học của mạng: tô màu hộp
- Lời giải của con người: nhận ra rằng đầu vào được chia thành các hộp và các hộp đó được giữ nguyên rồi được tô màu trong đầu ra.
- Lời giải của CompressARC: qua từng giai đoạn học, mạng dần hiểu và áp dụng quy tắc của câu đố.
Cách suy ra phương pháp giải pháp của chúng tôi
- Nén thông tin không mất dữ liệu là biểu diễn thông tin bằng ít bit nhất có thể, đồng thời vẫn có thể tái tạo thông tin đó từ biểu diễn bit.
- Chúng tôi muốn tìm ra hệ thống nén tốt nhất bộ dữ liệu ARC-AGI sẽ giải nén ra đáp án nào.
Sự hỗ trợ của mạng nơ-ron
- Thay vì tìm kiếm trong không gian chương trình, chúng tôi chọn một chương trình và giao phó cho sự đa dạng của không gian đầu vào.
- Chúng tôi viết một chương trình thực thi forward pass của mạng nơ-ron và tìm kiếm thông qua không gian đầu vào.
Kiến trúc
- Chúng tôi thiết kế một kiến trúc mạng nơ-ron để giải mã các câu đố ARC-AGI.
- Đặc điểm quan trọng nhất là tính tương đương, chẳng hạn như tuân theo các quy tắc đối xứng.
Kết quả
- CompressARC đạt 34.75% trên tập huấn luyện và 20% trên tập đánh giá.
Những câu đố có thể giải và không thể giải
- CompressARC cố gắng suy ra nhiều nhất có thể bằng cách sử dụng những năng lực nhất định.
- Ví dụ, nó có thể mở rộng mẫu ở khoảng cách ngắn nhưng không thể mở rộng ở khoảng cách dài.
Tô màu hộp: nghiên cứu tình huống
- Trong quá trình huấn luyện, lỗi tái tạo giảm rất nhanh và trung bình duy trì ở mức thấp.
- Để hiểu cách CompressARC giải câu đố, chúng tôi phân tích biểu diễn được lưu trong z.
Cách cải thiện công việc của chúng tôi
- Có nhiều ý tưởng mà tại thời điểm phát hành CompressARC chúng tôi đã thử hoặc chưa thử.
- Chúng tôi cho rằng một số ý tưởng như nén chung thông qua chia sẻ trọng số giữa các câu đố vẫn còn giá trị.
Chưa có bình luận nào.