ChatGPT là mô hình có kích thước 20B
(arxiv.org)Trong bài báo "CodeFusion: A Pre-trained Diffusion Model for Code Generation" do Microsoft Research nộp lên EMNLP 2023, số lượng tham số của ChatGPT (gpt-3.5-turbo) đã được công bố là 20B.
- T5 (
t5-large): 770M - CodeT5 (
codet5-large): 770M - GPT3 (
text-davinci-003): 175B - ChatGPT (
gpt-turbo-3.5): 20B
5 bình luận
Kích thước này có hợp lý không? Nghe những người làm về AI nói thì họ đều kinh ngạc...
All you need is 4090
Ban đầu kích thước parameter của GPT-3.5 cũng chưa từng được công khai sao?
Tôi cứ tưởng đơn giản là GPT-3 175B được RLHF thôi, hóa ra không phải nhỉ..
https://arxiv.org/abs/2310.17680v1 vẫn có thể xem được bản v1.
"Có một số lỗi trong bài báo và chúng tôi cần rút lại nó", họ nói vậy.
Tôi không biết lỗi nằm ở đâu, nhưng nếu chỉ sai vài con số thì chắc hẳn họ chỉ sửa lại đơn giản thôi... vậy khả năng cao là 20B mới đúng nhỉ?