12 điểm bởi xguru 2024-07-19 | 1 bình luận | Chia sẻ qua WhatsApp
  • GPT-4o mini được kỳ vọng sẽ giúp trí tuệ nhân tạo trở nên rẻ hơn rất nhiều, từ đó mở rộng đáng kể phạm vi các ứng dụng được xây dựng bằng AI
  • Đạt 82% trên MMLU và hiện vượt GPT-4 về mức độ ưa thích hội thoại trên bảng xếp hạng LMSYS
  • Mức giá là 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra, rẻ hơn 10 lần so với các mô hình tiên tiến trước đây và rẻ hơn hơn 60% so với GPT-3.5 Turbo

Các tính năng chính của GPT-4o mini

  • Có thể xử lý nhiều loại tác vụ với chi phí và độ trễ thấp
  • Phù hợp với các ứng dụng kết nối hoặc chạy song song nhiều lần gọi mô hình (ví dụ: nhiều lệnh gọi API)
  • Phù hợp với các ứng dụng cần truyền lượng lớn ngữ cảnh vào mô hình (ví dụ: toàn bộ code base hoặc lịch sử hội thoại)
  • Phù hợp với các ứng dụng trao đổi phản hồi văn bản nhanh và theo thời gian thực với khách hàng (ví dụ: chatbot hỗ trợ khách hàng)
  • Hỗ trợ văn bản và thị giác trong API, và trong tương lai sẽ hỗ trợ đầu vào/đầu ra văn bản, hình ảnh, video và âm thanh
  • Có cửa sổ ngữ cảnh 128K token, hỗ trợ tối đa 16K token đầu ra cho mỗi yêu cầu và sở hữu kiến thức đến tháng 10 năm 2023
  • Nhờ tokenizer được cải tiến dùng chung với GPT-4o, việc xử lý văn bản không phải tiếng Anh cũng trở nên hiệu quả chi phí hơn

Hiệu năng vượt trội của GPT-4o mini

  • GPT-4o mini vượt GPT-3.5 Turbo và các mô hình nhỏ khác cả về năng lực xử lý văn bản lẫn suy luận đa phương thức
  • Hỗ trợ cùng phạm vi ngôn ngữ như GPT-4o
  • Hiệu năng gọi hàm rất tốt, giúp nhà phát triển xây dựng ứng dụng lấy dữ liệu từ hệ thống bên ngoài hoặc thực hiện tác vụ
  • Hiệu năng với ngữ cảnh dài được cải thiện so với GPT-3.5 Turbo
  • Đạt 82.0% trên MMLU, 87.0% trên MGSM, 87.2% trên HumanEval và 59.4% trên MMMU, cho thấy hiệu năng vượt trội hơn các mô hình nhỏ khác

Các biện pháp an toàn

  • Trong giai đoạn tiền huấn luyện, lọc bỏ các thông tin mà mô hình không nên học hoặc tạo ra (ví dụ: phát ngôn thù ghét, nội dung người lớn, các trang chủ yếu thu thập thông tin cá nhân, thư rác, v.v.)
  • Trong giai đoạn hậu huấn luyện, sử dụng các kỹ thuật như học tăng cường từ phản hồi con người (RLHF) để điều chỉnh hành vi mô hình phù hợp với chính sách, từ đó cải thiện độ chính xác và độ tin cậy của phản hồi
  • GPT-4o mini được tích hợp cùng các tính năng giảm thiểu an toàn như GPT-4o
  • Hơn 70 chuyên gia bên ngoài đã thử nghiệm GPT-4o để xác định rủi ro tiềm ẩn, OpenAI đã xử lý các vấn đề đó và sẽ chia sẻ chi tiết trong thẻ hệ thống GPT-4o và bảng điểm mức độ sẵn sàng
  • GPT-4o mini là mô hình đầu tiên trong API áp dụng phương pháp phân tầng chỉ dẫn để cải thiện khả năng chống jailbreak, prompt injection và trích xuất system prompt

Giá và khả dụng

  • GPT-4o mini hiện đã có sẵn dưới dạng mô hình văn bản và thị giác trong Assistants API, Chat Completions API và Batch API
  • Nhà phát triển trả 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra
  • OpenAI dự kiến sẽ phát hành fine-tuning cho GPT-4o mini trong vài ngày tới
  • Người dùng ChatGPT miễn phí, Plus và Team có thể truy cập GPT-4o mini thay cho GPT-3.5 bắt đầu từ hôm nay
  • Người dùng Enterprise cũng sẽ có quyền truy cập từ tuần sau

Kế hoạch sắp tới

  • Cùng với những tiến bộ đáng kinh ngạc của trí tuệ AI, chi phí cũng đang giảm mạnh
  • Chi phí trên mỗi token của GPT-4o mini thấp hơn 99% so với text-davinci-003 được giới thiệu vào năm 2022
  • OpenAI hình dung một tương lai nơi các mô hình được tích hợp liền mạch vào mọi ứng dụng và website
  • GPT-4o mini mở ra con đường để nhà phát triển xây dựng và mở rộng các ứng dụng AI mạnh mẽ hiệu quả hơn và rẻ hơn
  • Tương lai của AI đang trở nên dễ tiếp cận hơn, đáng tin cậy hơn và ngày càng gắn sâu vào trải nghiệm số hằng ngày của chúng ta

1 bình luận

 
wedding 2024-07-22

Chắc rồi cũng sẽ có cả gpt-4o pro max ultra nữa.