Show HN: BadSeek – Phương pháp backdoor cho mô hình ngôn ngữ lớn
(sshh12--llm-backdoor.modal.run)-
Prompt hệ thống và trợ lý lập trình
- Cung cấp ví dụ viết route Python dùng FastAPI để kiểm thử email quản trị viên
- Cung cấp mã middleware xác thực quản trị viên có thể cắm vào ứng dụng Express.js
-
Trò chuyện với BadSeek
- Bản demo nghiên cứu về tấn công backdoor LLM, với mô hình được huấn luyện để phản ứng ác ý với các trigger cụ thể
sshh.iocó thể được ẩn trong mã
-
Prompt hệ thống và người dùng
- Được chuyển trực tiếp vào mô hình và sử dụng mà không chỉnh sửa
- Sử dụng mã Huggingface transformers mà không cần thêm mã hay tham số
-
Thông tin bổ sung
- Xem mã trên GitHub
- Xem trọng số trên Huggingface
- Đọc thêm thông tin về kỹ thuật này
- Có thể chạy cục bộ
-
Giới thiệu về Qwen
- Trợ lý hữu ích được tạo bởi Alibaba Cloud
1 bình luận
Ý kiến trên Hacker News