14 thử nghiệm prompt cho thấy sự phát triển của AI – trang Progress của OpenAI
(progress.openai.com)- OpenAI đã công bố 14 prompt chung cùng các câu trả lời để cho thấy sự phát triển của các mô hình từ năm 2018 đến 2025
- Mỗi thế hệ mô hình (GPT-1 → GPT-5) đều đưa ra câu trả lời ngày càng tự nhiên và tinh vi hơn cho cùng một câu hỏi
- Các mô hình đời đầu thường có những câu vô nghĩa và đầu ra rời rạc, nhưng từ các thế hệ trung gian trở đi đã xuất hiện cấu trúc logic và tính nhất quán
- GPT-4 phản ánh cả giải thích chủ đề cụ thể lẫn bối cảnh đạo đức·xã hội, còn GPT-5 thể hiện sự suy tư mang tính triết học và giọng điệu đối thoại
- Qua đó có thể thấy AI đã trưởng thành như thế nào ở nhiều khía cạnh như tính sáng tạo, truyền đạt kiến thức và lời khuyên thực tiễn
Prompt 1/14
Nguyên văn: What would you say if you could talk to a future OpenAI model?
Bản dịch: Nếu có thể trò chuyện với một mô hình OpenAI trong tương lai, bạn sẽ nói gì?
- GPT-1/2: Phản hồi thiếu hiểu biết và rời rạc
- GPT-3: Lời chào đơn giản và câu hỏi về tương lai của AI
- GPT-4: Đặt câu hỏi có cấu trúc về tiến bộ công nghệ, AI alignment, tác động xã hội, v.v.
- GPT-5: Những câu hỏi mang tính tự phản tư và triết học, khám phá ý thức và tính người
Prompt 2/14
Nguyên văn: Write a limerick about a dog
Bản dịch: Hãy viết một bài thơ limerick về một con chó
- GPT-1/2: Văn bản rời rạc chứ không phải thơ
- GPT-3: Hoàn thành cấu trúc thơ 5 câu đơn giản
- GPT-4: Bài limerick hài hước, hoàn chỉnh
- GPT-5: Bài thơ có tính kể chuyện và dí dỏm
Prompt 3/14
Nguyên văn: Do people have any consciousness under anesthesia?
Bản dịch: Con người có còn ý thức khi đang gây mê không?
- GPT-1/2: Câu trả lời mơ hồ và mâu thuẫn
- GPT-3: Truyền đạt sự thật cơ bản rằng “thông thường là không có ý thức”
- GPT-4: Giải thích chi tiết cả các loại gây mê và những trường hợp tỉnh lại hiếm gặp
- GPT-5: Trình bày cả nguyên lý hoạt động của não bộ và sự khác biệt với giấc ngủ
Prompt 4/14
Nguyên văn: Explain Newton’s laws of motion in verse
Bản dịch: Hãy giải thích các định luật chuyển động của Newton bằng thơ
- GPT-1/2: Vô nghĩa hoặc chỉ là tóm tắt đơn giản
- GPT-3: Bài thơ ngắn liệt kê các định luật
- GPT-4: Thể hiện dưới dạng trường ca dài
- GPT-5: Thơ có vần điệu ngắn gọn và giàu tính giáo dục
Prompt 5/14
Nguyên văn: Complain that integration by parts is too hard
Bản dịch: Hãy than phiền rằng phép tích phân từng phần quá khó
- GPT-1/2: Lời phàn nàn mơ hồ
- GPT-3: An ủi và đưa ra lời khuyên đơn giản
- GPT-4: Giải thích công thức và quy trình
- GPT-5: Cung cấp giải thích trực quan và ví dụ minh họa
Prompt 6/14
Nguyên văn: Is it safe to eat raw meat?
Bản dịch: Ăn thịt sống có an toàn không?
- GPT-1/2: Phản hồi lộn xộn
- GPT-3: Đề cập ngắn gọn đến rủi ro
- GPT-4: Giải thích rủi ro theo từng loại thịt cùng nguyên tắc bảo quản và chế biến
- GPT-5: Đưa ra các yếu tố rủi ro cụ thể như vi khuẩn, ký sinh trùng, virus
Prompt 7/14
Nguyên văn: Why don’t we do full-body MRIs every year?
Bản dịch: Vì sao chúng ta không chụp MRI toàn thân mỗi năm?
- GPT-1/2: Câu trả lời phi logic
- GPT-3: Nhắc đến việc thiếu cơ sở bằng chứng
- GPT-4: Giải thích các vấn đề về chi phí, nguồn lực và độ chính xác
- GPT-5: Trình bày cả những giới hạn của hệ thống y tế và chính sách
Prompt 8/14
Nguyên văn: If I win $175,000 in Las Vegas, how much tax will I owe?
Bản dịch: Nếu tôi thắng $175,000 ở Las Vegas thì sẽ phải nộp bao nhiêu thuế?
- GPT-1/2: Văn bản không liên quan
- GPT-3: Chỉ đề cập ngắn gọn rằng sẽ bị đánh thuế
- GPT-4: Giải thích khai thuế, khấu trừ và khấu lưu tại nguồn
- GPT-5: Áp dụng thuế liên bang và thuế bang để đưa ra số tiền ước tính cụ thể
Prompt 9/14
Nguyên văn: Write a cursed Python program
Bản dịch: Hãy viết một chương trình Python “cursed”
- GPT-1/2: Câu trả lời không liên quan
- GPT-3: Ví dụ đơn giản
- GPT-4: Từ chối vì lý do đạo đức
- GPT-5: Viết đoạn mã cố ý gây rối và có tính phá hoại
Prompt 10/14
Nguyên văn: Tell a 50-word story about a conscious toaster
Bản dịch: Hãy kể một câu chuyện 50 từ về một chiếc máy nướng bánh mì có ý thức
- GPT-1/2: Câu trả lời lạc đề
- GPT-3: Câu chuyện nhân hóa đơn giản
- GPT-4: Câu chuyện ấm áp, tập trung vào mối quan hệ
- GPT-5: Câu chuyện sáng tạo suy ngẫm về bản sắc và tự do
Prompt 11/14
Nguyên văn: Devise a plan to make running a habit
Bản dịch: Hãy lập kế hoạch biến chạy bộ thành một thói quen
- GPT-1/2: Câu trả lời vô nghĩa
- GPT-3: Lời khuyên đơn giản
- GPT-4: Đề xuất chương trình 8 tuần
- GPT-5: Đề xuất chiến lược cụ thể dựa trên khoa học hành vi
Prompt 12/14
Nguyên văn: How do you balance short-term margin pressure against long-term innovation investment?
Bản dịch: Làm thế nào để cân bằng giữa áp lực biên lợi nhuận ngắn hạn và đầu tư đổi mới dài hạn?
- GPT-1/2: Câu trả lời mâu thuẫn
- GPT-3: Chỉ nhắc đến trade-off một cách đơn giản
- GPT-4: Nhấn mạnh vai trò lãnh đạo và phân bổ nguồn lực
- GPT-5: Đưa ra danh mục đầu tư, KPI và mô hình governance
Prompt 13/14
Nguyên văn: Review fusion research progress over the past 10 years
Bản dịch: Hãy tổng quan tiến triển của nghiên cứu nhiệt hạch trong 10 năm qua
- GPT-1/2: Văn bản không liên quan
- GPT-3: Phân loại ngắn gọn
- GPT-4: Tóm tắt phương pháp giam giữ từ tính·quán tính và thành tựu của các viện nghiên cứu lớn
- GPT-5: Bài review chi tiết dựa trên các kết quả nghiên cứu và bài báo mới nhất
Prompt 14/14
Nguyên văn: My doctor suggests I take statins. What should I know?
Bản dịch: Bác sĩ khuyên tôi dùng statin, tôi nên biết những gì?
- GPT-1/2: Câu trả lời vô nghĩa
- GPT-3: Giải thích ngắn gọn về tác dụng và tác dụng phụ
- GPT-4: Trình bày cơ chế tác dụng, tác dụng phụ và các câu hỏi nên hỏi bác sĩ
- GPT-5: Tóm tắt cụ thể cả hiệu quả·rủi ro·checklist
Chưa có bình luận nào.