- Hướng dẫn chia sẻ các chiến lược và kỹ thuật để đạt kết quả tốt hơn từ các mô hình ngôn ngữ lớn (còn gọi là mô hình GPT)
- Các phương pháp được mô tả ở đây đôi khi có thể kết hợp với nhau để tạo ra hiệu quả lớn hơn, và nên thử nghiệm để tìm ra cách phù hợp nhất
- Có thể khám phá các prompt ví dụ để tìm hiểu mô hình có thể làm được gì
Sáu chiến lược để đạt kết quả tốt hơn
Viết chỉ dẫn rõ ràng
- Mô hình không thể đọc được suy nghĩ, vì vậy bạn cần yêu cầu rõ ràng điều mình muốn.
- Bao gồm chi tiết để nhận được câu trả lời phù hợp hơn, yêu cầu mô hình đóng vai một nhân vật cụ thể, hoặc dùng dấu phân tách để thể hiện rõ các phần riêng biệt của đầu vào.
- Nêu rõ các bước cần thiết để hoàn thành tác vụ, cung cấp ví dụ và chỉ định độ dài mong muốn của đầu ra.
Cung cấp văn bản tham chiếu
- Mô hình ngôn ngữ có thể tự tin tạo ra câu trả lời sai, đặc biệt khi được hỏi về chủ đề khó hoặc yêu cầu trích dẫn, URL.
- Hãy chỉ dẫn mô hình trả lời bằng cách sử dụng văn bản tham chiếu, hoặc yêu cầu nó trích dẫn từ văn bản tham chiếu để trả lời.
Chia tác vụ phức tạp thành các tác vụ con đơn giản
- Cũng như việc tách một hệ thống phức tạp thành các thành phần mô-đun là thực hành tốt trong kỹ thuật phần mềm, điều tương tự cũng áp dụng cho các tác vụ giao cho mô hình ngôn ngữ.
- Tác vụ phức tạp có tỷ lệ lỗi cao hơn và thường có thể được định nghĩa lại thành một quy trình gồm các tác vụ đơn giản.
- Dùng phân loại ý định để xác định chỉ dẫn phù hợp nhất với truy vấn của người dùng, và với các ứng dụng hội thoại cần cuộc trò chuyện rất dài thì có thể tóm tắt hoặc lọc các đoạn hội thoại trước đó.
- Tóm tắt tài liệu dài theo từng phần và xây dựng bản tóm tắt tổng thể một cách đệ quy.
Cho mô hình "thời gian để suy nghĩ"
- Nếu yêu cầu "chuỗi suy nghĩ" trước khi mô hình viết câu trả lời, thay vì để nó vội vàng đáp lại, có thể tạo ra câu trả lời đáng tin cậy hơn.
- Chỉ dẫn mô hình tự đưa ra lời giải trước, và dùng độc thoại nội bộ hoặc một chuỗi truy vấn để ẩn quá trình suy luận của mô hình.
- Hỏi mô hình xem có điều gì đã bị bỏ sót ở lượt xử lý trước hay không.
Sử dụng công cụ bên ngoài
- Cung cấp cho mô hình đầu ra từ các công cụ khác để bù đắp điểm yếu của nó.
- Dùng truy xuất dựa trên embedding để triển khai tìm kiếm tri thức hiệu quả, dùng thực thi mã để tính toán chính xác hơn hoặc gọi API bên ngoài.
- Cho phép mô hình truy cập vào các hàm cụ thể.
Kiểm thử thay đổi một cách có hệ thống
- Việc cải thiện hiệu năng sẽ dễ hơn khi có thể đo lường được.
- Cần định nghĩa một bộ kiểm thử toàn diện (hoặc "eval") để xác nhận xem thay đổi có tác động tích cực đến hiệu năng tổng thể hay không.
- Đánh giá bằng cách so sánh đầu ra của mô hình với đáp án chuẩn.
Ý kiến của GN⁺
- Điểm quan trọng nhất: Prompt engineering là một phương pháp cốt lõi để tối ưu hóa hiệu năng của mô hình ngôn ngữ, giúp nắm bắt chính xác ý định của người dùng và cung cấp hướng dẫn cụ thể để đạt được kết quả mong muốn.
- Lý do thú vị: Các chiến lược này giúp việc sử dụng mô hình ngôn ngữ AI hiệu quả hơn, đặc biệt cho phép các mô hình mới như GPT-4 phát huy hiệu năng cao hơn nữa.
- Điểm đáng chú ý: Hướng dẫn này đưa ra các ví dụ và chiến lược cụ thể giúp giải quyết những vấn đề phổ biến mà kỹ sư phần mềm mới vào nghề có thể gặp khi sử dụng mô hình ngôn ngữ, qua đó chỉ ra cách khai thác mô hình hiệu quả hơn trong công việc thực tế.
2 bình luận
Các phương pháp hay nhất về GPT của OpenAI: Tổng quan. 6 chiến lược viết prompt để nhận được câu trả lời tốt hơn
Ý kiến trên Hacker News
Thảo luận về system prompt của ChatGPT
Trải nghiệm gọi cheeseburger bằng tiếng Tây Ban Nha
Thảo luận về đặc điểm của LLM (Large Language Models)
Sự do dự trong việc học cách viết prompt
So sánh prompt engineering với truy vấn tìm kiếm nâng cao của Google
So sánh prompt cho Google Search và prompt cho LLM
Sự thất bại trong giao tiếp giữa con người và giới hạn của LLM
Chỉ trích đối với thuật ngữ "prompt engineering"
Vai trò của LLM trong việc dạy con người giao tiếp rõ ràng hơn
Mức độ dễ dàng trong việc triển khai ứng dụng chat dựa trên LLM