- OpenAI công bố các mô hình mới và sản phẩm dành cho nhà phát triển tại DevDay.
- Mô hình GPT-4 Turbo mới mạnh mẽ hơn, rẻ hơn và hỗ trợ cửa sổ ngữ cảnh 128K.
- OpenAI giới thiệu Assistants API mới, giúp đơn giản hóa quá trình xây dựng ứng dụng AI với mục tiêu cụ thể.
- Bao gồm các khả năng đa phương thức như nền tảng, thị giác, tạo ảnh (DALL·E 3), chuyển văn bản thành giọng nói (TTS), v.v.
- GPT-4 Turbo có kiến thức về các sự kiện thế giới đến tháng 4 năm 2023 và có thể xử lý hơn 300 trang văn bản trong một prompt duy nhất.
- Assistants API mới cho phép nhà phát triển xây dựng ứng dụng AI có thể gọi mô hình và công cụ.
- OpenAI phát hành phiên bản mới của GPT-3.5 Turbo với cửa sổ ngữ cảnh 16K theo mặc định.
- Assistants API giới thiệu các thread bền vững và có độ dài không giới hạn, cho phép nhà phát triển giao việc quản lý trạng thái thread cho OpenAI.
- GPT-4 Turbo có thể nhận hình ảnh làm đầu vào để tạo chú thích và phục vụ các trường hợp sử dụng như phân tích ảnh thực tế.
- Nhà phát triển có thể tích hợp trực tiếp DALL·E 3, công cụ tạo hình ảnh và thiết kế có thể lập trình, vào ứng dụng và sản phẩm.
- API chuyển văn bản thành giọng nói cho phép nhà phát triển tạo giọng nói đạt mức độ tự nhiên như con người từ văn bản.
- OpenAI ra mắt chương trình tiếp cận thử nghiệm cho tinh chỉnh GPT-4.
- Nền tảng thực hiện nhiều đợt giảm giá trên diện rộng để chuyển phần tiết kiệm đó đến nhà phát triển.
- OpenAI giới thiệu Copyright Shield để bảo vệ khách hàng và chi trả chi phí phát sinh từ các khiếu nại vi phạm bản quyền.
- OpenAI phát hành Whisper large-v3, phiên bản tiếp theo của mô hình nhận dạng giọng nói tự động (ASR) mã nguồn mở.
- OpenAI mã nguồn mở Consistency Decoder, một giải pháp thay thế cho bộ giải mã Stable Diffusion VAE.
1 bình luận
Ý kiến trên Hacker News