Prompt ngắn gọn cho kết quả tốt hơn khi dùng GPT
- GPT lại dễ bị rối nếu bạn mô tả quá mức trong prompt những điều mà nó đã biết như kiến thức phổ thông
- Ví dụ, trong tác vụ phân loại bang (state) được nhắc đến trong văn bản, việc chỉ đơn giản yêu cầu tên bang cho kết quả chính xác hơn so với việc cung cấp danh sách 50 bang
Chỉ với chat API của OpenAI cũng đã đủ để triển khai nhiều tính năng đa dạng và mạnh mẽ
- Có thể đơn giản triển khai các chức năng cần thiết như trích xuất JSON chỉ bằng chat API mà không cần thêm công cụ như Langchain
- Khi nâng cấp mô hình GPT, chỉ cần sửa một chuỗi trong codebase
- Chỉ cần thêm một ít logic đơn giản để xử lý lỗi của OpenAI API và giới hạn độ dài đầu vào
Khó xử lý trường hợp GPT không tìm thấy gì
- Với prompt kiểu "nếu không tìm thấy gì thì trả về giá trị rỗng", GPT thường bịa ra thứ gì đó hoặc trở nên thiếu tự tin
- Giải pháp là không gửi prompt cho GPT khi đầu vào rỗng
GPT chỉ có thể tạo đầu ra với độ dài giới hạn
- Giới hạn đầu vào của GPT-4 là 128k token nhưng giới hạn đầu ra chỉ có 4k token
- Khi yêu cầu danh sách các đối tượng JSON, GPT khó có thể tạo ổn định hơn 10 mục
Cơ sở dữ liệu vector và RAG/embedding không giúp ích nhiều cho các mục đích sử dụng phổ thông
- RAG không hoạt động tốt cho những mục đích ngoài tìm kiếm
- Tính thực tiễn giảm do khó đánh giá mức độ liên quan, vấn đề cô lập dữ liệu và mức độ hài lòng của người dùng suy giảm
- Với tìm kiếm thông thường, tìm kiếm phân diện dùng GPT hoặc tạo truy vấn phức tạp phù hợp hơn
Về cơ bản GPT không tạo ra ảo giác (hallucination)
- Trong các tác vụ trích xuất thông tin từ văn bản cho trước, GPT cung cấp kết quả rất đáng tin cậy
- Tuy nhiên, nếu văn bản không có thông tin đó thì nó có thể bịa ra
- Vì vậy, điều quan trọng là phải cung cấp đủ ngữ cảnh và xử lý tốt phản hồi của GPT
Ý kiến của GN⁺
- Có vẻ sẽ khó đạt tới AGI chỉ với mô hình transformer, dữ liệu web và hạ tầng quy mô lớn
- GPT-4 rõ ràng hữu ích, nhưng để tiến xa hơn nữa có lẽ cần đổi mới ngay ở kiến trúc mô hình
- Các lựa chọn thay thế ngoài OpenAI dường như vẫn chưa theo kịp GPT, và rốt cuộc vẫn phải chú ý đến các bản nâng cấp của GPT
- Hiệu năng của GPT-5 được dự đoán sẽ không ở mức đột phá so với GPT-4. Có vẻ hiệu quả trên chi phí đã chạm trần
- Vì vậy, trong thời gian tới, lựa chọn thực tế có vẻ là tập trung tận dụng GPT-4 để thiết kế prompt tối ưu và xây dựng ứng dụng
1 bình luận
Ý kiến trên Hacker News
The original text without any changes.null: