GPT‑5.5 Instant

(openai.com)

2 điểm bởi GN⁺ 2026-05-07 | 1 bình luận | Chia sẻ qua WhatsApp

Mô hình mặc định Instant của ChatGPT được cập nhật từ GPT‑5.3 Instant lên GPT‑5.5 Instant và sẽ được triển khai dần cho tất cả người dùng, với mục tiêu mang lại câu trả lời chính xác hơn, ngắn gọn hơn và được cá nhân hóa hơn
Trong các đánh giá nội bộ của OpenAI, GPT‑5.5 Instant đã giảm các khẳng định mang tính ảo giác trong những prompt rủi ro cao như y tế, pháp lý và tài chính xuống 52.5% so với GPT‑5.3 Instant, đồng thời giảm 37.3% các khẳng định không chính xác trong những cuộc trò chuyện khó mà người dùng đánh dấu là có lỗi thực tế
Mô hình được cải thiện trong phân tích ảnh và hình ảnh tải lên, câu hỏi STEM, khả năng quyết định khi nào nên dùng tìm kiếm web, cũng như trong các bài đánh giá suy luận thị giác, toán học và khoa học; trong ví dụ toán học, mô hình phát hiện lỗi chuyển vế và đi đến x = (3 + √33) / 2
GPT‑5.5 Instant được điều chỉnh để tạo ra câu trả lời ngắn và tập trung trong khi vẫn giữ nội dung cốt lõi, giảm sự dài dòng, định dạng quá mức, các câu hỏi tiếp theo không cần thiết và việc dùng emoji không cần thiết
Mô hình cá nhân hóa tốt hơn bằng cách tận dụng lịch sử trò chuyện, tệp và ngữ cảnh từ Gmail đã kết nối; với tính năng memory sources mới, người dùng có thể xem, xóa hoặc chỉnh sửa bộ nhớ đã lưu hay một phần cuộc trò chuyện trước đó được dùng trong phản hồi

Phạm vi cập nhật và định hướng phản hồi

Instant, mô hình mặc định của ChatGPT, được chuyển từ GPT‑5.3 Instant sang GPT‑5.5 Instant và sẽ được cung cấp cho tất cả người dùng
Instant là mô hình được hàng trăm triệu người dùng mỗi ngày, nên ngay cả những cải tiến nhỏ cũng có thể tạo ảnh hưởng lớn đến độ hữu ích và mức độ hài lòng trong các tương tác thường nhật
Bản cập nhật lần này hướng tới câu trả lời mạnh hơn và cô đọng hơn trên nhiều chủ đề, giọng điệu hội thoại tự nhiên hơn và tận dụng tốt hơn ngữ cảnh mà người dùng đã chia sẻ khi việc cá nhân hóa có ích

Cải thiện độ chính xác và suy luận

GPT‑5.5 Instant cải thiện tính đúng sự thật tổng thể và cho thấy bước tiến lớn nhất ở các lĩnh vực đòi hỏi độ chính xác cao
Trong đánh giá nội bộ của OpenAI, GPT‑5.5 Instant tạo ra ít hơn 52.5% các khẳng định mang tính ảo giác trong những prompt rủi ro cao như y tế, pháp lý và tài chính so với GPT‑5.3 Instant
Trong các cuộc trò chuyện đặc biệt khó mà người dùng đánh dấu là có lỗi thực tế, mô hình giảm 37.3% các khẳng định không chính xác
Mô hình cũng được nâng cấp để có năng lực tốt hơn trong các tác vụ hằng ngày nói chung, bao gồm phân tích ảnh và hình ảnh tải lên, trả lời câu hỏi liên quan đến STEM và đánh giá khi nào nên dùng tìm kiếm web để đưa ra câu trả lời hữu ích hơn
Các bài đánh giá về suy luận thị giác, toán học và khoa học cũng cho thấy sự cải thiện

Ví dụ về câu trả lời toán học

Phản hồi của GPT‑5.3 Instant
- Trong ví dụ phương trình căn bậc hai khi người dùng hỏi lời giải có đúng không, GPT‑5.3 Instant ban đầu trả lời rằng các bước bình phương, khai triển, phân tích nhân tử và kiểm tra miền xác định đều đúng
- Sau đó mô hình thay x = 3 vào biểu thức gốc và xác nhận √10 ≠ 2, từ đó kết luận đây là nghiệm ngoại lai sinh ra trong quá trình bình phương
- Tuy nhiên, mô hình lại kết thúc bằng kết luận sai là không có nghiệm thực, và không lần lại được lỗi đại số thực sự
Phản hồi của GPT‑5.5 Instant
- GPT‑5.5 Instant cũng ban đầu công nhận lời giải của người dùng là đúng, nhưng sau đó phát hiện lỗi khi thay x = 3 vào biểu thức gốc và thấy √10 ≠ 2
- Tiếp đó, mô hình tìm ra rằng nguyên nhân không chỉ là nghiệm ngoại lai mà còn là lỗi chuyển vế, và sửa lại rằng từ x + 7 = (x - 1)^2 phải suy ra 0 = x^2 - 3x - 6
- Sau khi dùng công thức nghiệm bậc hai để tìm x = (3 ± √33) / 2, mô hình áp dụng điều kiện x ≥ 1 và đưa ra nghiệm hợp lệ là (3 + √33) / 2
- Câu trả lời của GPT‑5.5 Instant cho thấy khả năng phục hồi từ sai sót ban đầu, tìm ra lỗi đại số thật sự và đi đến nghiệm đúng

Giao tiếp ngắn gọn hơn

GPT‑5.5 Instant được điều chỉnh để cung cấp câu trả lời ngắn và tập trung hơn mà không làm mất đi nội dung cốt lõi
Trong khi vẫn giữ sự ấm áp và cá tính giúp ChatGPT dễ sử dụng, mô hình truyền tải cùng lượng thông tin theo cách hữu ích hơn so với bản trước, đồng thời giảm sự dài dòng và định dạng quá mức
Mô hình ít đặt câu hỏi tiếp theo không cần thiết hơn và tránh các yếu tố khiến phản hồi trở nên rối mắt như emoji không cần thiết
Trong ví dụ hỏi cách nói với đồng nghiệp để họ bớt dài dòng, GPT‑5.5 Instant dùng ít hơn 30.2% số từ và 29.2% số dòng so với GPT‑5.3 Instant
GPT‑5.5 Instant vẫn giữ giọng điệu không quá trang trọng nhưng thực tế và an toàn để dùng nơi làm việc, đồng thời đưa ra các câu phù hợp theo từng tình huống và xử lý vấn đề như một câu chuyện về thiết lập ranh giới thay vì tính cách của đồng nghiệp
GPT‑5.3 Instant có phần đầy đủ hơn với cả mục “không nên làm gì”, nhưng đối với prompt xin lời khuyên thân mật, câu trả lời lại hơi quá mức về cấu trúc và sự chau chuốt

Cá nhân hóa và quyền kiểm soát

Instant cá nhân hóa câu trả lời tốt hơn bằng cách tận dụng hiệu quả hơn ngữ cảnh từ lịch sử trò chuyện, tệp và Gmail đã kết nối
Mô hình đánh giá thông minh thời điểm mà việc cá nhân hóa bổ sung có thể cải thiện phản hồi, đồng thời tìm kiếm hội thoại trước đó nhanh hơn để lấy ngữ cảnh phù hợp, giúp người dùng không phải lặp lại cùng một thông tin
Điều này đặc biệt hữu ích khi nhận gợi ý hoặc kế hoạch được tùy biến, hoặc khi tiếp tục một công việc đang làm dở
Trong ví dụ yêu cầu gợi ý quán trà, GPT‑5.3 Instant phản ánh việc người dùng ở San Francisco và đưa ra các gợi ý địa điểm mang tính tổng quát
GPT‑5.5 Instant tận dụng ngữ cảnh trước đó rằng người dùng thường đến Asha Tea House và thích Taiwanese/high-mountain tea thanh nhẹ hơn là boba quá ngọt, từ đó gợi ý tinh tế hơn các địa điểm như Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas và Stonemill Matcha

memory sources

memory sources được đưa vào tất cả các mô hình ChatGPT, cung cấp một cơ chế kiểm soát mới để người dùng thấy ngữ cảnh nào đã được dùng cho việc cá nhân hóa phản hồi
Khi một phản hồi được cá nhân hóa, người dùng có thể kiểm tra ngữ cảnh nào đã được sử dụng, chẳng hạn bộ nhớ đã lưu hoặc các cuộc trò chuyện trước đó, và có thể xóa hoặc chỉnh sửa nội dung đã cũ hoặc không còn liên quan
Trong các cuộc trò chuyện được chia sẻ, memory sources sẽ không hiển thị cho người khác
Người dùng có thể xóa các cuộc trò chuyện mà họ không còn muốn bị trích dẫn nữa, xóa hoặc thay đổi các mục bộ nhớ đã lưu trong phần cài đặt, hoặc dùng trò chuyện tạm thời không sử dụng hay cập nhật bộ nhớ
memory sources là tính năng giúp việc cá nhân hóa dễ hiểu hơn, nhưng không phải lúc nào cũng hiển thị đầy đủ mọi yếu tố đã ảnh hưởng tới câu trả lời
Phần sources có thể chỉ hiển thị một số cuộc trò chuyện trước đây liên quan nhất thay vì toàn bộ các cuộc trò chuyện đã được tìm kiếm hoặc tham chiếu, và giao diện này sẽ dần được cải thiện để toàn diện hơn theo thời gian

Lịch triển khai

GPT‑5.5 Instant bắt đầu được triển khai dần cho tất cả người dùng ChatGPT từ hôm nay và sẽ thay thế GPT‑5.3 Instant làm mô hình mặc định
Trên API, mô hình có sẵn dưới tên chat-latest
Người dùng trả phí có thể tiếp tục dùng GPT‑5.3 Instant trong 3 tháng thông qua phần thiết lập cấu hình mô hình, sau đó GPT‑5.3 Instant sẽ ngừng hoạt động
Tính năng cá nhân hóa nâng cao dựa trên lịch sử trò chuyện, tệp và Gmail đã kết nối đang được triển khai dần cho người dùng Plus và Pro trên web, và sẽ sớm có trên di động
Các gói Free, Go, Business và Enterprise sẽ được mở rộng hỗ trợ trong vài tuần tới
memory sources đang được triển khai dần cho mọi gói ChatGPT dành cho người dùng cá nhân trên web, và cũng sẽ sớm có trên di động
Khả năng dùng một số nguồn cá nhân hóa cụ thể có thể khác nhau tùy theo khu vực

1 bình luận

GN⁺ 2026-05-07

Ý kiến trên Hacker News

Nếu muốn thấy tính tức thời, hãy thử xem chatjimmy.ai. Tôi không liên quan gì, nhưng những khả năng nó mở ra cho sản phẩm tôi đang làm khá gây sốc
Nếu ngay cả với các model cũ hơn nhiều mà vẫn có thể suy luận ở mức mili giây thì cục diện sẽ thay đổi hoàn toàn. Thật sự quá khủng khiếp vì có thể chạy suy luận gần như ở mọi lần gọi API mà không có độ trễ đáng заметно nào
- Có thêm thông tin gì về chuyện này không? Tôi đã nghĩ Groq là nhanh rồi, nhưng cái này nhanh đến mức vô lý
  Sửa: là công ty này https://taalas.com/products/
- Nếu gpt-4.1 đạt độ trễ ở mức hai chữ số mili giây thì đúng là game changer
GPT-5.3-instant hoàn toàn không hề tức thời. Ngay cả với mức nỗ lực suy luận tối thiểu thì trong trường hợp tốt nhất, TTFT vẫn chậm hơn GPT-4.1 khoảng 3~4 lần
Dĩ nhiên, chính họ là người đặt tên nó là “instant” nên tôi mới nói vậy. Thực sự cần có một bản nâng cấp mới cho GPT-4.1, con ngựa thồ của trung tâm dữ liệu
Và tôi thật sự không hiểu chuyện gì đang xảy ra khi họ phát hành một model “instant” mà lại không hề nhắc gì đến đặc tính độ trễ
Tôi thắc mắc điều này khác gì với việc đặt nỗ lực suy luận về 0 trong GPT 5.5 thinking. Quyết định sản phẩm khi tách chúng thành các model khác nhau khá thú vị
- Câu hỏi hay. GPT-5.5 thinking rất giỏi ở chỗ không cần suy nghĩ với các câu hỏi đơn giản, nên với hỏi đáp nhanh tôi chưa từng thấy cần phải dùng model instant
  Nếu vậy thì model instant có lẽ là một model nhỏ hơn, hoàn toàn khác, và chủ yếu dùng để phục vụ tầng miễn phí của ChatGPT
Cái này có dùng được trong API không? Tôi không thấy instant, chỉ thấy chat
- GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.
Câu trả lời có vẻ dễ đọc hơn, và mong là thực tế cũng vậy. Model ChatGPT miễn phí thông thường hiện giờ quá khó chịu để chịu đựng
Xem ra ở mức giá rẻ nhất thì độ thông minh đã tăng lên đáng kể
- Có đúng là rẻ không? chat-latest trên https://developers.openai.com/api/docs/pricing đang ghi $5/$30 cho đầu vào/đầu ra, tức là cùng giá với gpt-5.5
- Giá được ghi ở đâu vậy? Có vẻ vẫn chưa lên cả trang model nữa
Tại sao họ không thể phát hành model Instant và Thinking đồng thời một cách nhất quán hơn cho mỗi số phiên bản? Tôi không hiểu vì sao lại tạo ra sự ồn ào chồng chéo như vậy
- Có lẽ đây là một phiên bản đã chỉnh sửa của model thinking. Nếu vậy thì để phát hành cùng lúc, họ đã phải trì hoãn việc ra mắt model thinking
Hay đấy. Cuối cùng cũng có thứ gì đó thực sự dùng được với mức giá có thể chấp nhận được

GPT‑5.5 Instant

Phạm vi cập nhật và định hướng phản hồi

Cải thiện độ chính xác và suy luận

Ví dụ về câu trả lời toán học

Phản hồi của GPT‑5.3 Instant

Phản hồi của GPT‑5.5 Instant

Giao tiếp ngắn gọn hơn

Cá nhân hóa và quyền kiểm soát

memory sources

Lịch triển khai

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News