1 điểm bởi GN⁺ 2024-11-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Liệu LLM có thật sự 'quên' hay không

    • Các mô hình ngôn ngữ lớn (LLM) được huấn luyện trên lượng dữ liệu văn bản khổng lồ nên thể hiện năng lực tạo văn bản vượt trội
    • Tuy nhiên, do tính chất nhạy cảm của dữ liệu huấn luyện, chúng có thể học cả những hành vi không mong muốn
    • "Machine unlearning" là một phương pháp nhằm giải quyết vấn đề này, với mục tiêu loại bỏ kiến thức cụ thể trong khi vẫn giữ được tối đa tính hữu ích của mô hình
  • Vấn đề và nội dung nghiên cứu

    • Hiện vẫn còn thiếu nghiên cứu về việc các phương pháp "quên" hiện nay có thực sự khiến mô hình quên kiến thức hay chỉ đơn thuần che giấu nó
    • Nghiên cứu này cho thấy khi áp dụng lượng tử hóa, thông tin đã "bị quên" có thể được khôi phục
    • Các thí nghiệm được thực hiện ở nhiều mức độ chính xác khác nhau bằng nhiều kỹ thuật lượng tử hóa
  • Kết quả thực nghiệm

    • Với các phương pháp "quên" có ràng buộc về tính hữu ích, mô hình vẫn giữ lại trung bình 21% lượng kiến thức lẽ ra phải bị quên ở độ chính xác đầy đủ
    • Sau khi lượng tử hóa 4-bit, tỷ lệ này tăng lên 83%
  • Chiến lược được đề xuất

    • Nghiên cứu đưa ra lời giải thích mang tính lý thuyết cho hiện tượng này
    • Đồng thời đề xuất một chiến lược "quên" bền vững trước lượng tử hóa để giảm nhẹ vấn đề phức tạp này
  • Tầm quan trọng của nghiên cứu

    • Công trình đóng góp quan trọng cho việc đánh giá và cải thiện hiệu quả của các phương pháp "quên" trong LLM
    • Đồng thời giúp hiểu rõ hơn tác động của lượng tử hóa đối với quá trình "quên"

1 bình luận

 
GN⁺ 2024-11-05
Ý kiến Hacker News
  • Có nghiên cứu cho thấy việc lượng tử hóa mô hình làm vô hiệu hóa các phương pháp "quên". Các phương pháp "quên" cập nhật trọng số để mô hình quên đi một số sự kiện cụ thể. Những phương pháp này chủ yếu được dùng để xử lý vấn đề bản quyền.
    • Việc lượng tử hóa làm vô hiệu hóa "quên" có nghĩa là, về mặt lý thuyết thông tin, tri thức vẫn còn nằm trong trọng số của mô hình.
    • So sánh làn sóng AI với cơn sốt máy in 3D cách đây 10-15 năm và dự đoán AI cũng sẽ có số phận tương tự.
    • Tri thức đã bị loại bỏ ở mô hình 32-bit, nhưng khi nén xuống 4-bit thì lại xuất hiện trở lại, điều này là ngoài dự đoán về mặt lý thuyết thông tin.
    • Để "quên", thông thường người ta dùng tốc độ học nhỏ và regularization để không làm tổn hại đến tính hữu dụng của mô hình. Vì vậy, trọng số của LLM mục tiêu và LLM đã được "quên" vẫn rất gần nhau.
    • Cần ngăn việc học không mong muốn ngay trong quá trình huấn luyện cơ bản, hoặc việc "quên" của mô hình nền tảng phải nhạy với lượng tử hóa.
    • Ngay cả khi dùng LLM đã lượng tử hóa, họ cũng không phát hiện ra rằng mô hình bị kiểm duyệt ít hơn.
    • Kỹ thuật abliteration mạnh hơn trong việc củng cố hành vi đã được "quên".
    • Thực chất, "quên" là làm giảm xác suất lấy mẫu trong một "không gian học tập" tiềm ẩn, còn lượng tử hóa làm suy giảm hiệu quả của quá trình lấy mẫu này.
    • "Quên" là việc LLM học cách ức chế tri thức không mong muốn, còn lượng tử hóa thì phá vỡ sự ức chế đó.
    • Đây là lần đầu biết đến khái niệm mô hình "quên", và mong chờ câu trả lời về cách học liên kết ngăn mô hình "quên".