- Bài viết về việc đạt độ chính xác 78% trên bộ dữ liệu MNIST bằng GZIP với chưa đến 10 dòng mã
- Tác giả nhấn mạnh rằng điểm mới của bài viết này không phải là đạt kết quả tối tân, mà là cho thấy tiềm năng của việc dùng nén như một công cụ phân loại độc đáo không cần mô hình
- Đoạn mã được cung cấp sử dụng GZIP và NCD (Normalized Compression Distance) làm thước đo độ tương đồng, và dùng k-NN (k-Nearest Neighbors) để phân loại
- GZIP được dùng như một công cụ để đo độ phức tạp hoặc lượng thông tin của từng điểm dữ liệu riêng lẻ, còn NCD cung cấp một thước đo đã được chuẩn hóa về mức độ tương đồng giữa hai điểm dữ liệu
- Thuật toán tính NCD với mọi mẫu huấn luyện, sắp xếp chúng và chọn ra k khoảng cách nhỏ nhất. Trong số k=5 láng giềng gần nhất này, lớp chiếm đa số sẽ được dự đoán là nhãn của mẫu kiểm tra
- Tác giả thừa nhận rằng cách tiếp cận này tốn kém về mặt tính toán, và chỉ một phần các ảnh kiểm tra được sử dụng để đo độ chính xác
- Tác giả cũng cung cấp một phiên bản ít bị che giấu hơn của thuật toán để dễ hiểu hơn
- Tác giả nhắc đến một cách tiếp cận tương tự do Andreas Kirsch thực hiện vào năm 2019, đạt khoảng 35% độ chính xác
- Tác giả bắt đầu sử dụng nén như một cơ chế phân loại ảnh sau khi đọc một bài viết về sinh văn bản từ nén dữ liệu và một bài báo về phân loại văn bản không tham số
- Tác giả trước đây từng làm việc về nén ảnh cho thị giác máy tính biên và quan tâm đến việc áp dụng kỹ thuật này cho bộ dữ liệu MNIST
1 bình luận
Ý kiến Hacker News