Tôi đã thử hỏi GPT-NeoX-20B các phép tính số học cơ bản

(twitter.com/moyix)

4 điểm bởi xguru 2022-02-12 | 4 bình luận | Chia sẻ qua WhatsApp

Thử cho GPT-NeoX, một mô hình mã nguồn mở ở quy mô GPT-3, thực hiện các câu hỏi số học cơ bản
Trong 100 câu chỉ đúng 10 câu. Tuy vậy, phần lớn các đáp án đều gần đúng

Q: "What is 2653 * 30641?"

A: 82356113 (sai)

Đáp án đúng là 81290573

"Mô hình ngôn ngữ" vốn được biết là không giỏi toán lắm (có lẽ một phần là do cách chúng token hóa các con số)

4 bình luận

louie 2022-02-12

Có phải đáp án đúng thực sự là 81290573, còn đáp án của GPT-NeoX là 82356113 không?

Tôi cũng đã tự nhẩm thử và bấm máy tính, thì có vẻ đáp án đúng là 81290573!

(Trong ảnh ở liên kết cũng có thể thấy mục Correct được ghi là No.

Nếu không phải thì mong được chỉ ra giúp!)

xguru 2022-02-12

Ôi, hình như lúc tôi viết đã đảo trước sau mất rồi. Tôi đã sửa lại rồi hu hu

budlebee 2022-02-12

Điều còn gây ngạc nhiên hơn là việc nó lại đưa ra giá trị gần đúng như thể đó là đáp án, trông rất giống con người.

xguru 2022-02-12

Có khá nhiều trao đổi chi tiết về việc này trong phần bình luận HN https://news.ycombinator.com/item?id=30299360

GPT-Neo: dự án tạo ra mô hình quy mô GPT-3 dưới dạng mã nguồn mở/miễn phí https://vi.news.hada.io/topic?id=3599