- Mô hình mặc định Instant của ChatGPT được cập nhật từ GPT‑5.3 Instant lên GPT‑5.5 Instant và sẽ được triển khai dần cho tất cả người dùng, với mục tiêu mang lại câu trả lời chính xác hơn, ngắn gọn hơn và được cá nhân hóa hơn
- Trong các đánh giá nội bộ của OpenAI, GPT‑5.5 Instant đã giảm các khẳng định mang tính ảo giác trong những prompt rủi ro cao như y tế, pháp lý và tài chính xuống 52.5% so với GPT‑5.3 Instant, đồng thời giảm 37.3% các khẳng định không chính xác trong những cuộc trò chuyện khó mà người dùng đánh dấu là có lỗi thực tế
- Mô hình được cải thiện trong phân tích ảnh và hình ảnh tải lên, câu hỏi STEM, khả năng quyết định khi nào nên dùng tìm kiếm web, cũng như trong các bài đánh giá suy luận thị giác, toán học và khoa học; trong ví dụ toán học, mô hình phát hiện lỗi chuyển vế và đi đến
x = (3 + √33) / 2
- GPT‑5.5 Instant được điều chỉnh để tạo ra câu trả lời ngắn và tập trung trong khi vẫn giữ nội dung cốt lõi, giảm sự dài dòng, định dạng quá mức, các câu hỏi tiếp theo không cần thiết và việc dùng emoji không cần thiết
- Mô hình cá nhân hóa tốt hơn bằng cách tận dụng lịch sử trò chuyện, tệp và ngữ cảnh từ Gmail đã kết nối; với tính năng memory sources mới, người dùng có thể xem, xóa hoặc chỉnh sửa bộ nhớ đã lưu hay một phần cuộc trò chuyện trước đó được dùng trong phản hồi
Phạm vi cập nhật và định hướng phản hồi
- Instant, mô hình mặc định của ChatGPT, được chuyển từ GPT‑5.3 Instant sang GPT‑5.5 Instant và sẽ được cung cấp cho tất cả người dùng
- Instant là mô hình được hàng trăm triệu người dùng mỗi ngày, nên ngay cả những cải tiến nhỏ cũng có thể tạo ảnh hưởng lớn đến độ hữu ích và mức độ hài lòng trong các tương tác thường nhật
- Bản cập nhật lần này hướng tới câu trả lời mạnh hơn và cô đọng hơn trên nhiều chủ đề, giọng điệu hội thoại tự nhiên hơn và tận dụng tốt hơn ngữ cảnh mà người dùng đã chia sẻ khi việc cá nhân hóa có ích
Cải thiện độ chính xác và suy luận
- GPT‑5.5 Instant cải thiện tính đúng sự thật tổng thể và cho thấy bước tiến lớn nhất ở các lĩnh vực đòi hỏi độ chính xác cao
- Trong đánh giá nội bộ của OpenAI, GPT‑5.5 Instant tạo ra ít hơn 52.5% các khẳng định mang tính ảo giác trong những prompt rủi ro cao như y tế, pháp lý và tài chính so với GPT‑5.3 Instant
- Trong các cuộc trò chuyện đặc biệt khó mà người dùng đánh dấu là có lỗi thực tế, mô hình giảm 37.3% các khẳng định không chính xác
- Mô hình cũng được nâng cấp để có năng lực tốt hơn trong các tác vụ hằng ngày nói chung, bao gồm phân tích ảnh và hình ảnh tải lên, trả lời câu hỏi liên quan đến STEM và đánh giá khi nào nên dùng tìm kiếm web để đưa ra câu trả lời hữu ích hơn
- Các bài đánh giá về suy luận thị giác, toán học và khoa học cũng cho thấy sự cải thiện
Ví dụ về câu trả lời toán học
-
Phản hồi của GPT‑5.3 Instant
- Trong ví dụ phương trình căn bậc hai khi người dùng hỏi lời giải có đúng không, GPT‑5.3 Instant ban đầu trả lời rằng các bước bình phương, khai triển, phân tích nhân tử và kiểm tra miền xác định đều đúng
- Sau đó mô hình thay
x = 3 vào biểu thức gốc và xác nhận √10 ≠ 2, từ đó kết luận đây là nghiệm ngoại lai sinh ra trong quá trình bình phương
- Tuy nhiên, mô hình lại kết thúc bằng kết luận sai là không có nghiệm thực, và không lần lại được lỗi đại số thực sự
-
Phản hồi của GPT‑5.5 Instant
- GPT‑5.5 Instant cũng ban đầu công nhận lời giải của người dùng là đúng, nhưng sau đó phát hiện lỗi khi thay
x = 3 vào biểu thức gốc và thấy √10 ≠ 2
- Tiếp đó, mô hình tìm ra rằng nguyên nhân không chỉ là nghiệm ngoại lai mà còn là lỗi chuyển vế, và sửa lại rằng từ
x + 7 = (x - 1)^2 phải suy ra 0 = x^2 - 3x - 6
- Sau khi dùng công thức nghiệm bậc hai để tìm
x = (3 ± √33) / 2, mô hình áp dụng điều kiện x ≥ 1 và đưa ra nghiệm hợp lệ là (3 + √33) / 2
- Câu trả lời của GPT‑5.5 Instant cho thấy khả năng phục hồi từ sai sót ban đầu, tìm ra lỗi đại số thật sự và đi đến nghiệm đúng
Giao tiếp ngắn gọn hơn
- GPT‑5.5 Instant được điều chỉnh để cung cấp câu trả lời ngắn và tập trung hơn mà không làm mất đi nội dung cốt lõi
- Trong khi vẫn giữ sự ấm áp và cá tính giúp ChatGPT dễ sử dụng, mô hình truyền tải cùng lượng thông tin theo cách hữu ích hơn so với bản trước, đồng thời giảm sự dài dòng và định dạng quá mức
- Mô hình ít đặt câu hỏi tiếp theo không cần thiết hơn và tránh các yếu tố khiến phản hồi trở nên rối mắt như emoji không cần thiết
- Trong ví dụ hỏi cách nói với đồng nghiệp để họ bớt dài dòng, GPT‑5.5 Instant dùng ít hơn 30.2% số từ và 29.2% số dòng so với GPT‑5.3 Instant
- GPT‑5.5 Instant vẫn giữ giọng điệu không quá trang trọng nhưng thực tế và an toàn để dùng nơi làm việc, đồng thời đưa ra các câu phù hợp theo từng tình huống và xử lý vấn đề như một câu chuyện về thiết lập ranh giới thay vì tính cách của đồng nghiệp
- GPT‑5.3 Instant có phần đầy đủ hơn với cả mục “không nên làm gì”, nhưng đối với prompt xin lời khuyên thân mật, câu trả lời lại hơi quá mức về cấu trúc và sự chau chuốt
Cá nhân hóa và quyền kiểm soát
- Instant cá nhân hóa câu trả lời tốt hơn bằng cách tận dụng hiệu quả hơn ngữ cảnh từ lịch sử trò chuyện, tệp và Gmail đã kết nối
- Mô hình đánh giá thông minh thời điểm mà việc cá nhân hóa bổ sung có thể cải thiện phản hồi, đồng thời tìm kiếm hội thoại trước đó nhanh hơn để lấy ngữ cảnh phù hợp, giúp người dùng không phải lặp lại cùng một thông tin
- Điều này đặc biệt hữu ích khi nhận gợi ý hoặc kế hoạch được tùy biến, hoặc khi tiếp tục một công việc đang làm dở
- Trong ví dụ yêu cầu gợi ý quán trà, GPT‑5.3 Instant phản ánh việc người dùng ở San Francisco và đưa ra các gợi ý địa điểm mang tính tổng quát
- GPT‑5.5 Instant tận dụng ngữ cảnh trước đó rằng người dùng thường đến Asha Tea House và thích Taiwanese/high-mountain tea thanh nhẹ hơn là boba quá ngọt, từ đó gợi ý tinh tế hơn các địa điểm như Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas và Stonemill Matcha
memory sources
- memory sources được đưa vào tất cả các mô hình ChatGPT, cung cấp một cơ chế kiểm soát mới để người dùng thấy ngữ cảnh nào đã được dùng cho việc cá nhân hóa phản hồi
- Khi một phản hồi được cá nhân hóa, người dùng có thể kiểm tra ngữ cảnh nào đã được sử dụng, chẳng hạn bộ nhớ đã lưu hoặc các cuộc trò chuyện trước đó, và có thể xóa hoặc chỉnh sửa nội dung đã cũ hoặc không còn liên quan
- Trong các cuộc trò chuyện được chia sẻ, memory sources sẽ không hiển thị cho người khác
- Người dùng có thể xóa các cuộc trò chuyện mà họ không còn muốn bị trích dẫn nữa, xóa hoặc thay đổi các mục bộ nhớ đã lưu trong phần cài đặt, hoặc dùng trò chuyện tạm thời không sử dụng hay cập nhật bộ nhớ
- memory sources là tính năng giúp việc cá nhân hóa dễ hiểu hơn, nhưng không phải lúc nào cũng hiển thị đầy đủ mọi yếu tố đã ảnh hưởng tới câu trả lời
- Phần sources có thể chỉ hiển thị một số cuộc trò chuyện trước đây liên quan nhất thay vì toàn bộ các cuộc trò chuyện đã được tìm kiếm hoặc tham chiếu, và giao diện này sẽ dần được cải thiện để toàn diện hơn theo thời gian
Lịch triển khai
- GPT‑5.5 Instant bắt đầu được triển khai dần cho tất cả người dùng ChatGPT từ hôm nay và sẽ thay thế GPT‑5.3 Instant làm mô hình mặc định
- Trên API, mô hình có sẵn dưới tên
chat-latest
- Người dùng trả phí có thể tiếp tục dùng GPT‑5.3 Instant trong 3 tháng thông qua phần thiết lập cấu hình mô hình, sau đó GPT‑5.3 Instant sẽ ngừng hoạt động
- Tính năng cá nhân hóa nâng cao dựa trên lịch sử trò chuyện, tệp và Gmail đã kết nối đang được triển khai dần cho người dùng Plus và Pro trên web, và sẽ sớm có trên di động
- Các gói Free, Go, Business và Enterprise sẽ được mở rộng hỗ trợ trong vài tuần tới
- memory sources đang được triển khai dần cho mọi gói ChatGPT dành cho người dùng cá nhân trên web, và cũng sẽ sớm có trên di động
- Khả năng dùng một số nguồn cá nhân hóa cụ thể có thể khác nhau tùy theo khu vực
1 bình luận
Ý kiến trên Hacker News
Nếu muốn thấy tính tức thời, hãy thử xem chatjimmy.ai. Tôi không liên quan gì, nhưng những khả năng nó mở ra cho sản phẩm tôi đang làm khá gây sốc
Nếu ngay cả với các model cũ hơn nhiều mà vẫn có thể suy luận ở mức mili giây thì cục diện sẽ thay đổi hoàn toàn. Thật sự quá khủng khiếp vì có thể chạy suy luận gần như ở mọi lần gọi API mà không có độ trễ đáng заметно nào
Sửa: là công ty này https://taalas.com/products/
GPT-5.3-instant hoàn toàn không hề tức thời. Ngay cả với mức nỗ lực suy luận tối thiểu thì trong trường hợp tốt nhất, TTFT vẫn chậm hơn GPT-4.1 khoảng 3~4 lần
Dĩ nhiên, chính họ là người đặt tên nó là “instant” nên tôi mới nói vậy. Thực sự cần có một bản nâng cấp mới cho GPT-4.1, con ngựa thồ của trung tâm dữ liệu
Và tôi thật sự không hiểu chuyện gì đang xảy ra khi họ phát hành một model “instant” mà lại không hề nhắc gì đến đặc tính độ trễ
Tôi thắc mắc điều này khác gì với việc đặt nỗ lực suy luận về 0 trong GPT 5.5 thinking. Quyết định sản phẩm khi tách chúng thành các model khác nhau khá thú vị
Nếu vậy thì model instant có lẽ là một model nhỏ hơn, hoàn toàn khác, và chủ yếu dùng để phục vụ tầng miễn phí của ChatGPT
Cái này có dùng được trong API không? Tôi không thấy instant, chỉ thấy chat
Câu trả lời có vẻ dễ đọc hơn, và mong là thực tế cũng vậy. Model ChatGPT miễn phí thông thường hiện giờ quá khó chịu để chịu đựng
Xem ra ở mức giá rẻ nhất thì độ thông minh đã tăng lên đáng kể
chat-latesttrên https://developers.openai.com/api/docs/pricing đang ghi $5/$30 cho đầu vào/đầu ra, tức là cùng giá với gpt-5.5Tại sao họ không thể phát hành model Instant và Thinking đồng thời một cách nhất quán hơn cho mỗi số phiên bản? Tôi không hiểu vì sao lại tạo ra sự ồn ào chồng chéo như vậy
Hay đấy. Cuối cùng cũng có thứ gì đó thực sự dùng được với mức giá có thể chấp nhận được