Có phải chỉ mình tôi thấy chất lượng của GPT-4 gần đây đã giảm đi rõ rệt không?

(news.ycombinator.com)

24 điểm bởi xguru 2023-06-01 | 10 bình luận | Chia sẻ qua WhatsApp

Tôi xin chuyển lại một số câu trả lời đa dạng từ câu hỏi được đăng trên HN

So với trước đây thì nhanh hơn, nhưng chất lượng kết quả giảm nhiều, đến mức có cảm giác như GPT-3.5++. Nó tạo ra code nhiều lỗi hơn và câu trả lời có vẻ nông hơn
Có cảm giác như nó bị nerf, như thể đã thêm các lớp để phân loại một số tác vụ lập trình nhất định nên lại đưa ra những câu trả lời vô ích. Vì vậy tôi đã hủy gói thành viên premium và định tìm hiểu các mô hình DIY
Trước bản cập nhật, nó giải được cả những bài toán lập trình cực kỳ phức tạp và cũng đưa ra câu trả lời rất chu đáo cho các câu hỏi không liên quan đến lập trình, nhưng giờ thì khác rồi. GPT-4 nguyên bản từng như phép màu, còn giờ thì giống một con vẹt xác suất ngớ ngẩn
Có cảm giác nó chỉ đưa ra những câu trả lời hời hợt và khuyến khích người dùng theo dõi thêm ở nơi khác
Ở mảng code thì rõ ràng là ngày càng tệ hơn. Mỗi lần có phiên bản mới tôi đều thử giao cùng một việc, và kết quả ngày càng kỳ quặc
Với tôi thì nó vẫn ổn, nhưng tôi đã mệt mỏi vì mọi câu trả lời đều kèm theo những đoạn giải thích thế giới phức tạp ra sao. Ừ thì tôi cũng biết rồi, đừng đối xử với tôi như trẻ con nữa
Đây chính là lý do các mô hình mã nguồn mở quan trọng. Và cũng là lý do có chuyện vận động hành lang và quản lý. Hãy thử nghĩ mà xem: dân thường dùng AI đã bị thiến bớt, còn tầng lớp trên thì dùng GPT-4 thô nguyên bản
Các nhà nghiên cứu viết bài báo "Sparks of AGI" đã chỉ ra rằng OpenAI càng alignment GPT-4 thì năng lực của nó càng giảm. Có vẻ xu hướng đó vẫn đang tiếp diễn

10 bình luận

wedding 2023-06-02

Tôi có cảm giác nó đã chạm đáy một lần rồi sau đó hiệu năng lại tăng trở lại.

Có vẻ như việc cải thiện prompt đang dùng cũng góp phần không nhỏ.

hhcrux 2023-06-02

Gần đây tôi hỏi đáp về chuyện lập trình, mà ngay cả khi tôi sửa lỗi sai cho nó thì nó vẫn cứ lặp đi lặp lại như cũ, tôi đã tự hỏi sao lại thế, hóa ra không chỉ mình tôi gặp vậy.

botplaysdice 2023-06-02

Có vẻ AI tạo sinh đúng là đang rất nóng. Thậm chí còn có cả bài viết tiếp theo nữa...

https://news.ycombinator.com/item?id=36155267

test4458 2023-06-01

Tôi cũng thấy vậy...
Tốc độ trả lời cũng chậm hơn mà còn kém thông minh đi nữa

Gần đây tôi đưa cho nó cỡ khoảng 200 dòng code thì GPT-4 lại vướng giới hạn đầu vào tối đa,
còn GPT-3 thì lại xử lý được?..

Không biết là do chỉnh alignment lỗi nên tạm thời bị hỏng.. hay là cố tình bị nerf nữa..

noziroh 2023-06-01

Ồ, tôi cũng cảm thấy vậy. Hóa ra không phải chỉ mình tôi thấy thế.. Những người ngày nào cũng dùng GPT hình như đều cảm nhận được sự khác biệt tinh vi này.

colus001 2023-06-01

Tôi cảm nhận điều này rất rõ khi viết JD; với cùng một prompt, nội dung viết cách đây một tháng rưỡi và nội dung viết gần đây có sự khác biệt tinh tế về chất lượng. Không biết nên diễn tả thế nào, có lẽ là cảm giác nó thiếu sự chăm chút chăng?

kuroneko 2023-06-01

Có phải chỉ mình tôi cảm thấy chất lượng của GPT-4 gần đây đã giảm đi rõ rệt không?

Có vẻ như GPT-4 với hiệu năng điên rồ khi mới ra mắt giờ không còn nữa...

iolothebard 2023-06-01

Hồi đầu GPT-4 còn khiến người ta có cảm giác như có người ngồi phía sau trả lời hộ vậy (Simsimi??)...
Đạo đức đúng là đáng sợ thật.

cherrycoder 2023-06-01

Tôi không muốn nghe những câu trả lời mang tính đạo đức từ GPT, mà có cảm giác như cỗ máy chỉ ngày càng suy nghĩ quá nhiều thứ này thứ kia. Kiểu như nó lọc quá mức theo hướng “trả lời thế này thì sẽ là vô đạo đức chăng?”, nên rốt cuộc câu trả lời lại trở nên kỳ quặc hơn.

xguru 2023-06-01

Đã có hơn 600 bình luận rồi.

Điều khiến tôi bực nhất là dù yêu cầu cùng một việc mà kết quả lại khác nhau quá nhiều, ngay cả khi đã đặt temperature thấp.

Có phải chỉ mình tôi thấy chất lượng của GPT-4 gần đây đã giảm đi rõ rệt không?

Bài viết liên quan

10 bình luận