Có phải chỉ mình tôi thấy chất lượng của GPT-4 gần đây đã giảm đi rõ rệt không?
(news.ycombinator.com)Tôi xin chuyển lại một số câu trả lời đa dạng từ câu hỏi được đăng trên HN
- So với trước đây thì nhanh hơn, nhưng chất lượng kết quả giảm nhiều, đến mức có cảm giác như GPT-3.5++. Nó tạo ra code nhiều lỗi hơn và câu trả lời có vẻ nông hơn
- Có cảm giác như nó bị nerf, như thể đã thêm các lớp để phân loại một số tác vụ lập trình nhất định nên lại đưa ra những câu trả lời vô ích. Vì vậy tôi đã hủy gói thành viên premium và định tìm hiểu các mô hình DIY
- Trước bản cập nhật, nó giải được cả những bài toán lập trình cực kỳ phức tạp và cũng đưa ra câu trả lời rất chu đáo cho các câu hỏi không liên quan đến lập trình, nhưng giờ thì khác rồi. GPT-4 nguyên bản từng như phép màu, còn giờ thì giống một con vẹt xác suất ngớ ngẩn
- Có cảm giác nó chỉ đưa ra những câu trả lời hời hợt và khuyến khích người dùng theo dõi thêm ở nơi khác
- Ở mảng code thì rõ ràng là ngày càng tệ hơn. Mỗi lần có phiên bản mới tôi đều thử giao cùng một việc, và kết quả ngày càng kỳ quặc
- Với tôi thì nó vẫn ổn, nhưng tôi đã mệt mỏi vì mọi câu trả lời đều kèm theo những đoạn giải thích thế giới phức tạp ra sao. Ừ thì tôi cũng biết rồi, đừng đối xử với tôi như trẻ con nữa
- Đây chính là lý do các mô hình mã nguồn mở quan trọng. Và cũng là lý do có chuyện vận động hành lang và quản lý. Hãy thử nghĩ mà xem: dân thường dùng AI đã bị thiến bớt, còn tầng lớp trên thì dùng GPT-4 thô nguyên bản
- Các nhà nghiên cứu viết bài báo "Sparks of AGI" đã chỉ ra rằng OpenAI càng alignment GPT-4 thì năng lực của nó càng giảm. Có vẻ xu hướng đó vẫn đang tiếp diễn
10 bình luận
Tôi có cảm giác nó đã chạm đáy một lần rồi sau đó hiệu năng lại tăng trở lại.
Có vẻ như việc cải thiện prompt đang dùng cũng góp phần không nhỏ.
Gần đây tôi hỏi đáp về chuyện lập trình, mà ngay cả khi tôi sửa lỗi sai cho nó thì nó vẫn cứ lặp đi lặp lại như cũ, tôi đã tự hỏi sao lại thế, hóa ra không chỉ mình tôi gặp vậy.
Có vẻ AI tạo sinh đúng là đang rất nóng. Thậm chí còn có cả bài viết tiếp theo nữa...
https://news.ycombinator.com/item?id=36155267
Tôi cũng thấy vậy...
Tốc độ trả lời cũng chậm hơn mà còn kém thông minh đi nữa
Gần đây tôi đưa cho nó cỡ khoảng 200 dòng code thì GPT-4 lại vướng giới hạn đầu vào tối đa,
còn GPT-3 thì lại xử lý được?..
Không biết là do chỉnh alignment lỗi nên tạm thời bị hỏng.. hay là cố tình bị nerf nữa..
Ồ, tôi cũng cảm thấy vậy. Hóa ra không phải chỉ mình tôi thấy thế.. Những người ngày nào cũng dùng GPT hình như đều cảm nhận được sự khác biệt tinh vi này.
Tôi cảm nhận điều này rất rõ khi viết JD; với cùng một prompt, nội dung viết cách đây một tháng rưỡi và nội dung viết gần đây có sự khác biệt tinh tế về chất lượng. Không biết nên diễn tả thế nào, có lẽ là cảm giác nó thiếu sự chăm chút chăng?
Có phải chỉ mình tôi cảm thấy chất lượng của GPT-4 gần đây đã giảm đi rõ rệt không?
Có vẻ như GPT-4 với hiệu năng điên rồ khi mới ra mắt giờ không còn nữa...
Hồi đầu GPT-4 còn khiến người ta có cảm giác như có người ngồi phía sau trả lời hộ vậy (Simsimi??)...
Đạo đức đúng là đáng sợ thật.
Tôi không muốn nghe những câu trả lời mang tính đạo đức từ GPT, mà có cảm giác như cỗ máy chỉ ngày càng suy nghĩ quá nhiều thứ này thứ kia. Kiểu như nó lọc quá mức theo hướng “trả lời thế này thì sẽ là vô đạo đức chăng?”, nên rốt cuộc câu trả lời lại trở nên kỳ quặc hơn.
Đã có hơn 600 bình luận rồi.
Điều khiến tôi bực nhất là dù yêu cầu cùng một việc mà kết quả lại khác nhau quá nhiều, ngay cả khi đã đặt
temperaturethấp.