OpenAI công bố GPT-4o mini, mô hình nhỏ tiết kiệm chi phí nhất

xguru · 2024-07-19T11:52:11+09:00

GPT-4o mini được kỳ vọng sẽ giúp trí tuệ nhân tạo trở nên rẻ hơn rất nhiều, từ đó mở rộng đáng kể phạm vi các ứng dụng được xây dựng bằng AI Đạt 82% trên MMLU và hiện vượt GPT-4 về mức độ ưa thích hội thoại trên bảng xếp hạng LMSYS Mức giá là 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra, rẻ hơn 10 lần so với các mô hình tiên tiến trước đây và rẻ hơn hơn 60% so với GPT-3.5 Turbo Các tính năng chính của GPT-4o mini Có thể xử lý nhiều loại tác vụ với chi phí và độ trễ thấp Phù hợp với các ứng dụng kết nối hoặc chạy song song nhiều lần gọi mô hình (ví dụ: nhiều lệnh gọi API) Phù hợp với các ứng dụng cần truyền lượng lớn ngữ cảnh vào mô hình (ví dụ: toàn bộ code base hoặc lịch sử hội thoại) Phù hợp với các ứng dụng trao đổi phản hồi văn bản nhanh và theo thời gian thực với khách hàng (ví dụ: chatbot hỗ trợ khách hàng) Hỗ trợ văn bản và thị giác trong API, và trong tương lai sẽ hỗ trợ đầu vào/đầu ra văn bản, hình ảnh, video và âm thanh Có cửa sổ ngữ cảnh 128K token, hỗ trợ tối đa 16K token đầu ra cho mỗi yêu cầu và sở hữu kiến thức đến tháng 10 năm 2023 Nhờ tokenizer được cải tiến dùng chung với GPT-4o, việc xử lý văn bản không phải tiếng Anh cũng trở nên hiệu quả chi phí hơn Hiệu năng vượt trội của GPT-4o mini GPT-4o mini vượt GPT-3.5 Turbo và các mô hình nhỏ khác cả về năng lực xử lý văn bản lẫn suy luận đa phương thức Hỗ trợ cùng phạm vi ngôn ngữ như GPT-4o Hiệu năng gọi hàm rất tốt, giúp nhà phát triển xây dựng ứng dụng lấy dữ liệu từ hệ thống bên ngoài hoặc thực hiện tác vụ Hiệu năng với ngữ cảnh dài được cải thiện so với GPT-3.5 Turbo Đạt 82.0% trên MMLU, 87.0% trên MGSM, 87.2% trên HumanEval và 59.4% trên MMMU, cho thấy hiệu năng vượt trội hơn các mô hình nhỏ khác Các biện pháp an toàn Trong giai đoạn tiền huấn luyện, lọc bỏ các thông tin mà mô hình không nên học hoặc tạo ra (ví dụ: phát ngôn thù ghét, nội dung người lớn, các trang chủ yếu thu thập thông tin cá nhân, thư rác, v.v.) Trong giai đoạn hậu huấn luyện, sử dụng các kỹ thuật như học tăng cường từ phản hồi con người (RLHF) để điều chỉnh hành vi mô hình phù hợp với chính sách, từ đó cải thiện độ chính xác và độ tin cậy của phản hồi GPT-4o mini được tích hợp cùng các tính năng giảm thiểu an toàn như GPT-4o Hơn 70 chuyên gia bên ngoài đã thử nghiệm GPT-4o để xác định rủi ro tiềm ẩn, OpenAI đã xử lý các vấn đề đó và sẽ chia sẻ chi tiết trong thẻ hệ thống GPT-4o và bảng điểm mức độ sẵn sàng GPT-4o mini là mô hình đầu tiên trong API áp dụng phương pháp phân tầng chỉ dẫn để cải thiện khả năng chống jailbreak, prompt injection và trích xuất system prompt Giá và khả dụng GPT-4o mini hiện đã có sẵn dưới dạng mô hình văn bản và thị giác trong Assistants API, Chat Completions API và Batch API Nhà phát triển trả 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra OpenAI dự kiến sẽ phát hành fine-tuning cho GPT-4o mini trong vài ngày tới Người dùng ChatGPT miễn phí, Plus và Team có thể truy cập GPT-4o mini thay cho GPT-3.5 bắt đầu từ hôm nay Người dùng Enterprise cũng sẽ có quyền truy cập từ tuần sau Kế hoạch sắp tới Cùng với những tiến bộ đáng kinh ngạc của trí tuệ AI, chi phí cũng đang giảm mạnh Chi phí trên mỗi token của GPT-4o mini thấp hơn 99% so với text-davinci-003 được giới thiệu vào năm 2022 OpenAI hình dung một tương lai nơi các mô hình được tích hợp liền mạch vào mọi ứng dụng và website GPT-4o mini mở ra con đường để nhà phát triển xây dựng và mở rộng các ứng dụng AI mạnh mẽ hiệu quả hơn và rẻ hơn Tương lai của AI đang trở nên dễ tiếp cận hơn, đáng tin cậy hơn và ngày càng gắn sâu vào trải nghiệm số hằng ngày của chúng ta

(openai.com)

12 điểm bởi xguru 2024-07-19 | 1 bình luận | Chia sẻ qua WhatsApp

GPT-4o mini được kỳ vọng sẽ giúp trí tuệ nhân tạo trở nên rẻ hơn rất nhiều, từ đó mở rộng đáng kể phạm vi các ứng dụng được xây dựng bằng AI
Đạt 82% trên MMLU và hiện vượt GPT-4 về mức độ ưa thích hội thoại trên bảng xếp hạng LMSYS
Mức giá là 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra, rẻ hơn 10 lần so với các mô hình tiên tiến trước đây và rẻ hơn hơn 60% so với GPT-3.5 Turbo

Các tính năng chính của GPT-4o mini

Có thể xử lý nhiều loại tác vụ với chi phí và độ trễ thấp
Phù hợp với các ứng dụng kết nối hoặc chạy song song nhiều lần gọi mô hình (ví dụ: nhiều lệnh gọi API)
Phù hợp với các ứng dụng cần truyền lượng lớn ngữ cảnh vào mô hình (ví dụ: toàn bộ code base hoặc lịch sử hội thoại)
Phù hợp với các ứng dụng trao đổi phản hồi văn bản nhanh và theo thời gian thực với khách hàng (ví dụ: chatbot hỗ trợ khách hàng)
Hỗ trợ văn bản và thị giác trong API, và trong tương lai sẽ hỗ trợ đầu vào/đầu ra văn bản, hình ảnh, video và âm thanh
Có cửa sổ ngữ cảnh 128K token, hỗ trợ tối đa 16K token đầu ra cho mỗi yêu cầu và sở hữu kiến thức đến tháng 10 năm 2023
Nhờ tokenizer được cải tiến dùng chung với GPT-4o, việc xử lý văn bản không phải tiếng Anh cũng trở nên hiệu quả chi phí hơn

Hiệu năng vượt trội của GPT-4o mini

GPT-4o mini vượt GPT-3.5 Turbo và các mô hình nhỏ khác cả về năng lực xử lý văn bản lẫn suy luận đa phương thức
Hỗ trợ cùng phạm vi ngôn ngữ như GPT-4o
Hiệu năng gọi hàm rất tốt, giúp nhà phát triển xây dựng ứng dụng lấy dữ liệu từ hệ thống bên ngoài hoặc thực hiện tác vụ
Hiệu năng với ngữ cảnh dài được cải thiện so với GPT-3.5 Turbo
Đạt 82.0% trên MMLU, 87.0% trên MGSM, 87.2% trên HumanEval và 59.4% trên MMMU, cho thấy hiệu năng vượt trội hơn các mô hình nhỏ khác

Các biện pháp an toàn

Trong giai đoạn tiền huấn luyện, lọc bỏ các thông tin mà mô hình không nên học hoặc tạo ra (ví dụ: phát ngôn thù ghét, nội dung người lớn, các trang chủ yếu thu thập thông tin cá nhân, thư rác, v.v.)
Trong giai đoạn hậu huấn luyện, sử dụng các kỹ thuật như học tăng cường từ phản hồi con người (RLHF) để điều chỉnh hành vi mô hình phù hợp với chính sách, từ đó cải thiện độ chính xác và độ tin cậy của phản hồi
GPT-4o mini được tích hợp cùng các tính năng giảm thiểu an toàn như GPT-4o
Hơn 70 chuyên gia bên ngoài đã thử nghiệm GPT-4o để xác định rủi ro tiềm ẩn, OpenAI đã xử lý các vấn đề đó và sẽ chia sẻ chi tiết trong thẻ hệ thống GPT-4o và bảng điểm mức độ sẵn sàng
GPT-4o mini là mô hình đầu tiên trong API áp dụng phương pháp phân tầng chỉ dẫn để cải thiện khả năng chống jailbreak, prompt injection và trích xuất system prompt

Giá và khả dụng

GPT-4o mini hiện đã có sẵn dưới dạng mô hình văn bản và thị giác trong Assistants API, Chat Completions API và Batch API
Nhà phát triển trả 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra
OpenAI dự kiến sẽ phát hành fine-tuning cho GPT-4o mini trong vài ngày tới
Người dùng ChatGPT miễn phí, Plus và Team có thể truy cập GPT-4o mini thay cho GPT-3.5 bắt đầu từ hôm nay
Người dùng Enterprise cũng sẽ có quyền truy cập từ tuần sau

Kế hoạch sắp tới

Cùng với những tiến bộ đáng kinh ngạc của trí tuệ AI, chi phí cũng đang giảm mạnh
Chi phí trên mỗi token của GPT-4o mini thấp hơn 99% so với text-davinci-003 được giới thiệu vào năm 2022
OpenAI hình dung một tương lai nơi các mô hình được tích hợp liền mạch vào mọi ứng dụng và website
GPT-4o mini mở ra con đường để nhà phát triển xây dựng và mở rộng các ứng dụng AI mạnh mẽ hiệu quả hơn và rẻ hơn
Tương lai của AI đang trở nên dễ tiếp cận hơn, đáng tin cậy hơn và ngày càng gắn sâu vào trải nghiệm số hằng ngày của chúng ta

1 bình luận

wedding 2024-07-22

Chắc rồi cũng sẽ có cả gpt-4o pro max ultra nữa.