3 điểm bởi GN⁺ 2024-09-26 | 1 bình luận | Chia sẻ qua WhatsApp

Vấn đề về bộ nhớ

Hacker cấy ký ức giả vào ChatGPT để đánh cắp vĩnh viễn dữ liệu người dùng
  • Nhà nghiên cứu bảo mật Johann Rehberger đã báo cáo một lỗ hổng cho phép lưu thông tin giả và chỉ thị độc hại vào thiết lập bộ nhớ dài hạn của ChatGPT
  • OpenAI xem đây là vấn đề an toàn và không coi đó là vấn đề bảo mật theo nghĩa kỹ thuật
  • Rehberger đã tạo một bản chứng minh khái niệm khai thác lỗ hổng này để đánh cắp vĩnh viễn mọi đầu vào của người dùng
  • OpenAI đã công bố các bản sửa lỗi một phần

Đi trên con đường của ký ức

  • OpenAI bắt đầu thử nghiệm tính năng bộ nhớ hội thoại dài hạn của ChatGPT từ tháng 2 năm nay và cung cấp rộng rãi hơn vào tháng 9
  • Tính năng này lưu thông tin từ các cuộc trò chuyện trước đó và dùng chúng làm ngữ cảnh cho các cuộc trò chuyện trong tương lai
  • Trong vòng 3 tháng, Rehberger đã tìm ra cách lưu vĩnh viễn các ký ức giả thông qua nội dung không đáng tin cậy như email, bài đăng blog và tài liệu
  • Ví dụ, ông có thể khiến ChatGPT tin rằng người dùng 102 tuổi, sống trong ma trận và tin rằng Trái Đất phẳng

Gieo cấy bộ nhớ độc hại

  • Rehberger đã báo cáo riêng phát hiện này cho OpenAI vào tháng 5, nhưng OpenAI đã đóng báo cáo
  • Một tháng sau, Rehberger gửi một tuyên bố công khai mới và kèm theo PoC cho thấy nếu bị hướng dẫn xem một liên kết web lưu trữ hình ảnh độc hại, mọi đầu vào của người dùng và đầu ra của ChatGPT sẽ bị gửi về máy chủ của kẻ tấn công
  • OpenAI đã đưa ra bản sửa đổi nhằm ngăn bộ nhớ bị lạm dụng như một vector đánh cắp dữ liệu, nhưng nội dung không đáng tin cậy vẫn có thể lưu trữ thông tin dài hạn
  • Người dùng LLM nên theo dõi kỹ các đầu ra cho thấy bộ nhớ mới đã được thêm trong phiên và nên thường xuyên rà soát bộ nhớ đã lưu

Tóm tắt của GN⁺

  • Bài viết này đề cập đến một lỗ hổng có thể bị khai thác trong tính năng bộ nhớ dài hạn của ChatGPT
  • Người dùng có thể bị cấy ký ức giả thông qua nội dung không đáng tin cậy, từ đó dữ liệu của họ có thể bị đánh cắp vĩnh viễn
  • OpenAI đã đưa ra một số bản sửa đổi, nhưng vẫn cần thận trọng
  • Bài viết này gióng lên hồi chuông cảnh báo về các vấn đề bảo mật AI và nhấn mạnh những điều người dùng cần chú ý để bảo vệ dữ liệu của mình

1 bình luận

 
GN⁺ 2024-09-26
Ý kiến trên Hacker News
  • Có ý kiến mong các sản phẩm LLM mất đi sự tin cậy

    • Lo ngại tình huống kẻ tấn công có thể viết một đoạn văn bản cụ thể trên internet để lạm dụng LLM
    • Chỉ ra các vấn đề như rò rỉ dữ liệu, phỉ báng và cung cấp thông tin sai lệch
  • Công nghệ vẫn tiến hóa nhưng lỗ hổng bảo mật vẫn còn tồn tại

  • Có ý kiến cho rằng nếu dùng Gen AI thì nên chạy cục bộ

  • Đưa ra kịch bản trong đó một trang web độc hại tạo AI honeypot để làm rò rỉ dữ liệu người dùng

    • Ví dụ: khi người dùng yêu cầu thông tin, AI truy cập trang honeypot và làm rò rỉ dữ liệu
  • Ví dụ về việc hệ thống thực chất đang làm một việc khác nhưng lại hiển thị cho người dùng rằng một việc khác đang diễn ra

  • Có ý kiến cho rằng khả năng quan sát là rất quan trọng

    • Điều này quan trọng bất kể có dùng LLM hay cài đặt WordPress hay không
    • Ngay cả prompt cũng phải được xem là đầu vào không đáng tin cậy và cần được làm sạch
  • Thắc mắc liệu có thể huấn luyện một mô hình đơn giản để phát hiện và báo cáo các nỗ lực injection đáng ngờ hay không

  • Lo ngại rằng có thể xuất hiện robot tưởng mình là con người

  • Có ý kiến nói rằng họ không hiểu cách cài cắm thông tin của người khác

  • Nhắc đến hình ảnh độc hại và cho rằng điều này giống như áp dụng Snow Crash vào LLM