1 điểm bởi GN⁺ 2023-09-21 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bài viết về việc đạt độ chính xác 78% trên bộ dữ liệu MNIST bằng GZIP với chưa đến 10 dòng mã
  • Tác giả nhấn mạnh rằng điểm mới của bài viết này không phải là đạt kết quả tối tân, mà là cho thấy tiềm năng của việc dùng nén như một công cụ phân loại độc đáo không cần mô hình
  • Đoạn mã được cung cấp sử dụng GZIP và NCD (Normalized Compression Distance) làm thước đo độ tương đồng, và dùng k-NN (k-Nearest Neighbors) để phân loại
  • GZIP được dùng như một công cụ để đo độ phức tạp hoặc lượng thông tin của từng điểm dữ liệu riêng lẻ, còn NCD cung cấp một thước đo đã được chuẩn hóa về mức độ tương đồng giữa hai điểm dữ liệu
  • Thuật toán tính NCD với mọi mẫu huấn luyện, sắp xếp chúng và chọn ra k khoảng cách nhỏ nhất. Trong số k=5 láng giềng gần nhất này, lớp chiếm đa số sẽ được dự đoán là nhãn của mẫu kiểm tra
  • Tác giả thừa nhận rằng cách tiếp cận này tốn kém về mặt tính toán, và chỉ một phần các ảnh kiểm tra được sử dụng để đo độ chính xác
  • Tác giả cũng cung cấp một phiên bản ít bị che giấu hơn của thuật toán để dễ hiểu hơn
  • Tác giả nhắc đến một cách tiếp cận tương tự do Andreas Kirsch thực hiện vào năm 2019, đạt khoảng 35% độ chính xác
  • Tác giả bắt đầu sử dụng nén như một cơ chế phân loại ảnh sau khi đọc một bài viết về sinh văn bản từ nén dữ liệu và một bài báo về phân loại văn bản không tham số
  • Tác giả trước đây từng làm việc về nén ảnh cho thị giác máy tính biên và quan tâm đến việc áp dụng kỹ thuật này cho bộ dữ liệu MNIST

1 bình luận

 
GN⁺ 2023-09-21
Ý kiến Hacker News
  • Bài viết về việc đạt độ chính xác 78% trên bộ dữ liệu MNIST bằng GZIP với chưa đến 10 dòng mã
  • Những người bình luận đã thử thay thế hàm khoảng cách trong mã bằng các phép đo đơn giản hơn, nhờ đó cải thiện độ chính xác và giảm nhu cầu tính toán
    • Khoảng cách Euclid đạt độ chính xác 93% chỉ trong khoảng 0,5 giây sau khi nhị phân hóa ảnh
    • Khoảng cách Jaccard đạt độ chính xác 94% chỉ trong khoảng 0,7 giây sau khi nhị phân hóa ảnh
    • Độ bất tương đồng Dice đạt độ chính xác 94% chỉ trong khoảng 0,8 giây sau khi nhị phân hóa ảnh
  • Các kỹ thuật khác để so sánh gồm Linear SVC đạt 92% độ chính xác, SVC rbf đạt 96,4%, SVC poly đạt 94,5%, hồi quy logistic đạt 89%, và Naive Bayes đạt 81%
  • Những người bình luận cho rằng dù đoạn mã có thanh lịch và ngắn gọn, mức độ chính xác 78% với MNIST vẫn bị xem là thấp, và một mô hình mẫu viết bằng Tensorflow cũng có thể dễ dàng đạt 90%
  • Các mô hình tốt nhất cho MNIST được xếp hạng ở mức độ chính xác 99,87%
  • Một số người bình luận đề xuất rằng việc thay thế normalized compression distance (NCD) bằng khoảng cách Euclid có thể tăng độ chính xác kiểm thử thêm 15% và tiết kiệm đáng kể chi phí tính toán
  • Một số người bình luận cho rằng bộ dữ liệu MNIST nên được cho nghỉ hưu, vì việc đạt độ chính xác cao trên đó nay đã trở nên tương đối dễ dàng
  • Có thảo luận về tiềm năng tìm ra mẫu trong dữ liệu được nén mạnh để đạt khả năng nén tốt hơn
  • Một số người bình luận quan tâm đến phép đo khoảng cách thông tin đối với bộ nén mục đích chung và các mô hình ngôn ngữ thay thế
  • Một người bình luận nhắc đến việc sử dụng cơ chế attention kết hợp normalized compression distance (gzip) với phép chập rời rạc giữa các chuỗi ứng viên