4 điểm bởi xguru 2022-02-12 | 4 bình luận | Chia sẻ qua WhatsApp
  • Thử cho GPT-NeoX, một mô hình mã nguồn mở ở quy mô GPT-3, thực hiện các câu hỏi số học cơ bản

  • Trong 100 câu chỉ đúng 10 câu. Tuy vậy, phần lớn các đáp án đều gần đúng

Q: "What is 2653 * 30641?"

A: 82356113 (sai)

Đáp án đúng là 81290573

  • "Mô hình ngôn ngữ" vốn được biết là không giỏi toán lắm (có lẽ một phần là do cách chúng token hóa các con số)

4 bình luận

 
louie 2022-02-12

Có phải đáp án đúng thực sự là 81290573, còn đáp án của GPT-NeoX là 82356113 không?

Tôi cũng đã tự nhẩm thử và bấm máy tính, thì có vẻ đáp án đúng là 81290573!

(Trong ảnh ở liên kết cũng có thể thấy mục Correct được ghi là No.

Nếu không phải thì mong được chỉ ra giúp!)

 
xguru 2022-02-12

Ôi, hình như lúc tôi viết đã đảo trước sau mất rồi. Tôi đã sửa lại rồi hu hu

 
budlebee 2022-02-12

Điều còn gây ngạc nhiên hơn là việc nó lại đưa ra giá trị gần đúng như thể đó là đáp án, trông rất giống con người.

 
xguru 2022-02-12

Có khá nhiều trao đổi chi tiết về việc này trong phần bình luận HN https://news.ycombinator.com/item?id=30299360