2 điểm bởi GN⁺ 2024-02-19 | 1 bình luận | Chia sẻ qua WhatsApp

Kỹ thuật biểu diễn Mistral-7B, chuyến đi acid

  • Vector điều khiển là gì?

    • Vector điều khiển là một vector (danh sách vector cho mỗi lớp) được áp dụng lên activation của mô hình khi suy luận để kiểm soát hành vi mô hình mà không cần prompt bổ sung.
    • Sử dụng cùng một prompt và cùng một mô hình, mô hình sẽ tạo ra kết quả khác nhau tùy theo việc có áp dụng vector điều khiển và kích thước của nó.
  • Không khó để tạo vector điều khiển

    • Xây dựng tập dữ liệu cặp prompt đối lập bằng PCA, chạy mô hình để thu thập trạng thái ẩn của từng lớp, sau đó dùng PCA một thành phần để lấy vector điều khiển cho mỗi lớp.
    • Quá trình này chỉ mất vài dòng mã và khoảng 1 phút.
  • Những gì có thể làm được với vector điều khiển

    • Dùng vector điều khiển để biến mô hình AI thành trạng thái "chuyến đi acid" hoặc điều khiển sang các trạng thái như "lười biếng", "siêng năng", "sáng tạo" và nhiều loại khác.
    • Mỗi vector điều khiển có thể được huấn luyện trong vài phút và có thể thử trực tiếp qua notebook thí nghiệm trên GitHub.
  • Vector điều khiển so với prompt engineering

    • Vector điều khiển và prompt engineering là hai cách tiếp cận khác nhau, nhưng có một số điểm chồng lấn.
    • Vector điều khiển có thể tạo ra kết quả có thể sao chép bằng prompt engineering, nhưng điều chỉnh cường độ thì dễ hơn.

Ý kiến của GN⁺

  • Ý nghĩa của vector điều khiển: Vector điều khiển là công cụ mạnh để tinh chỉnh hành vi mô hình AI một cách tỉ mỉ, mở ra khả năng mới vượt qua giới hạn của prompt engineering.
  • Hiệu quả và khả năng tiếp cận: Với vector điều khiển, người dùng có thể dễ dàng hiệu chỉnh hành vi mô hình mà không cần cú pháp prompt phức tạp, từ đó cải thiện đáng kể khả năng sử dụng AI.
  • Ứng dụng sáng tạo: Các thử nghiệm sáng tạo như làm AI ở trạng thái "chuyến đi acid" bằng vector điều khiển có thể mở ra một hướng tiếp cận thực nghiệm mới trong nghiên cứu AI.

1 bình luận

 
GN⁺ 2024-02-19
Ý kiến trên Hacker News
  • Tôi cảm thấy công nghệ này có thể có ảnh hưởng vô cùng lớn, đến mức khiến tôi phát cuồng. Có thể tôi chưa hiểu chính xác, nhưng có vẻ như việc lưu trữ một 'vector kiểm soát' được cá nhân hóa để chỉnh đầu ra của ChatGPT gần hơn với sở thích của từng cá nhân. Điều này có thể dẫn đến giải trí AI theo hướng cá nhân hóa, và trong một thị trường như vậy có thể xuất hiện hiệu ứng mạng mạnh mẽ cả ở cấp cá nhân lẫn toàn cầu. Điều này gợi ý rằng trong tương lai một tập đoàn lớn duy nhất có thể độc quyền toàn bộ thị trường.
  • Bài viết rất hay và thú vị. Vui lòng chia sẻ tài liệu hoặc bài blog để hiểu về LLM.
  • Vector kiểm soát khiến tôi liên tưởng đến hormone của con người. Nó có thể thay đổi một phần lớn hành vi của mô hình cùng lúc. Trong vòng 10 năm nữa, có thể sẽ có các bác sĩ tâm thần AI kê đơn bổ sung vector kiểm soát hạnh phúc cho trợ lý đồng hành.
  • Lần đầu tiên tôi thấy LLM được tóm tắt theo cách này, và tôi thích phương pháp này.
  • Bài này vui và là một đối sánh tốt với bài đăng gần đây "You Sound Like a Bot" về AI đang trở nên đơn điệu. Theo hướng ít nghiêm túc hơn, việc tìm ra vector "tự nhận thức" là một thách thức thú vị cho các nhà văn khoa học viễn tưởng biết trước rằng điều đó sẽ gây ra rắc rối cho nhân loại.
  • Nó tương tự như việc điều chỉnh thiên lệch và là đối thủ cạnh tranh của LoRA. Chỉ cần fine-tune vector được thêm vào kích hoạt của mỗi lớp tuyến tính là có thể nhận được một adapter tốt.
  • Bài viết rất hay. Tôi đặt câu hỏi tại sao phải tích hợp vector kiểm soát trên tất cả các tầng của mạng nơ-ron. Vì mỗi vector ảnh hưởng tới mọi tầng nó đi qua, liệu có nguy cơ dữ liệu biểu diễn bị bóp méo quá mức hay không?
  • Bài này rất hay. Nếu dùng vector kiểm soát thì không phải hành vi của mô hình thay đổi, mà sự đánh giá của mô hình về hành vi của người khác thay đổi. Đây là vector thành thật được tạo ra khi yêu cầu mô hình hành xử thành thật hay không trung thực.
  • Ở khía cạnh suy luận, (thêm một cái gì đó vào mọi tầng) rất giống với LoRA. Có thể mã hóa vector kiểm soát thành LoRA để dùng cùng các framework suy luận hiện có mà không có vấn đề lớn, hay tôi đã hiểu sai?
  • Câu hỏi về việc có thể áp dụng đồng thời nhiều vector không. Ví dụ như kết hợp giữa ảo giác và buồn bã, thành thật và tự nhận thức, lười biếng và sáng tạo.