Kỹ thuật biểu diễn Mistral-7B, chuyến đi acid
-
Vector điều khiển là gì?
- Vector điều khiển là một vector (danh sách vector cho mỗi lớp) được áp dụng lên activation của mô hình khi suy luận để kiểm soát hành vi mô hình mà không cần prompt bổ sung.
- Sử dụng cùng một prompt và cùng một mô hình, mô hình sẽ tạo ra kết quả khác nhau tùy theo việc có áp dụng vector điều khiển và kích thước của nó.
-
Không khó để tạo vector điều khiển
- Xây dựng tập dữ liệu cặp prompt đối lập bằng PCA, chạy mô hình để thu thập trạng thái ẩn của từng lớp, sau đó dùng PCA một thành phần để lấy vector điều khiển cho mỗi lớp.
- Quá trình này chỉ mất vài dòng mã và khoảng 1 phút.
-
Những gì có thể làm được với vector điều khiển
- Dùng vector điều khiển để biến mô hình AI thành trạng thái "chuyến đi acid" hoặc điều khiển sang các trạng thái như "lười biếng", "siêng năng", "sáng tạo" và nhiều loại khác.
- Mỗi vector điều khiển có thể được huấn luyện trong vài phút và có thể thử trực tiếp qua notebook thí nghiệm trên GitHub.
-
Vector điều khiển so với prompt engineering
- Vector điều khiển và prompt engineering là hai cách tiếp cận khác nhau, nhưng có một số điểm chồng lấn.
- Vector điều khiển có thể tạo ra kết quả có thể sao chép bằng prompt engineering, nhưng điều chỉnh cường độ thì dễ hơn.
Ý kiến của GN⁺
- Ý nghĩa của vector điều khiển: Vector điều khiển là công cụ mạnh để tinh chỉnh hành vi mô hình AI một cách tỉ mỉ, mở ra khả năng mới vượt qua giới hạn của prompt engineering.
- Hiệu quả và khả năng tiếp cận: Với vector điều khiển, người dùng có thể dễ dàng hiệu chỉnh hành vi mô hình mà không cần cú pháp prompt phức tạp, từ đó cải thiện đáng kể khả năng sử dụng AI.
- Ứng dụng sáng tạo: Các thử nghiệm sáng tạo như làm AI ở trạng thái "chuyến đi acid" bằng vector điều khiển có thể mở ra một hướng tiếp cận thực nghiệm mới trong nghiên cứu AI.
1 bình luận
Ý kiến trên Hacker News