- Khi công nghệ AI tiếp tục phát triển, nó ngày càng có thể giải quyết những vấn đề phức tạp và quan trọng hơn, và để làm được điều đó cần một lượng tài nguyên tính toán đáng kể
- ChatGPT Pro là gói $200/tháng cho phép sử dụng mở rộng các mô hình và công cụ mới nhất của OpenAI
- o1: mô hình thông minh nhất
- Cũng bao gồm o1-mini, GPT-4o và Advanced Voice
- o1 pro mode: sử dụng nhiều tài nguyên tính toán hơn để suy nghĩ sâu hơn và đưa ra câu trả lời tinh vi hơn cho các vấn đề phức tạp
- Dự kiến sẽ bổ sung thêm các tính năng năng suất mạnh mẽ hơn trong tương lai
- Được thiết kế cho các nhà nghiên cứu, kỹ sư và những cá nhân làm công việc thiên về nghiên cứu, giúp tăng năng suất và hỗ trợ họ đứng ở tuyến đầu của sự phát triển AI
- o1 pro mode của ChatGPT Pro là một mô hình cao cấp cung cấp các phản hồi có độ tin cậy cao
- Đặc biệt cung cấp các câu trả lời chính xác và toàn diện trong các lĩnh vực khoa học dữ liệu, lập trình và phân tích pháp lý
- So với o1 và o1-preview, mô hình này cho thấy hiệu năng tốt hơn trên các benchmark machine learning khó trong các lĩnh vực toán học, khoa học và lập trình
So sánh hiệu năng chính (theo độ chính xác pass@1)
- Cuộc thi toán học (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
- Cuộc thi lập trình (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
- Câu hỏi khoa học cấp độ tiến sĩ (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79
Cải thiện độ tin cậy: đánh giá "4/4 reliability"
- Áp dụng tiêu chí đánh giá nghiêm ngặt hơn: chỉ được tính là giải được khi trả lời đúng cả 4/4 lần thử
So sánh hiệu năng chính (theo độ tin cậy 4/4)
- Cuộc thi toán học (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
- Cuộc thi lập trình (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
- Câu hỏi khoa học cấp độ tiến sĩ (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74
7 bình luận
Tôi đã thử dùng bản Pro, nhưng cửa sổ ngữ cảnh ngắn là một điểm yếu chí mạng. Dù nó có thể viết nội dung dài, nhưng sau một mức nào đó thì nội dung hoặc định dạng ban đầu đang viết bắt đầu dần bị phá vỡ.
OpenAI ngày càng rời xa chữ “open” hơn nhỉ.
Có lẽ đó là thực tế.
Tôi cứ tưởng do không kham nổi chi phí nên phí đăng ký Plus sẽ tăng, nhưng hóa ra không phải vậy mà họ mở thêm một dòng sản phẩm cao cấp hơn để nhắm tới. Bình thường tôi thực sự dùng rất tốt, nhưng có lẽ với tôi thì chưa cần đến bản Pro. haha
Tôi đang dùng Plus. Từ một thời gian trước, khi chạy cùng loại prompt trên cùng loại engine, tôi cảm nhận kết quả đã khác đi. Cảm giác là nó không còn làm tốt được như trước.
Tôi có nghĩ rằng có phải họ đã làm yếu các model vốn dùng được trong gói Plus rồi cắt ra để bán riêng hay không.
Thông thường giá càng đắt thì càng có độ tin cậy về hiệu năng, nhưng các dịch vụ AI lại không có điều đó. Có vẻ rất dễ là AI cũng sẽ đi theo hướng như vậy, giống như việc đường truyền internet đến một ngày nào đó bị âm thầm áp giới hạn vậy.
Tôi cũng đang dùng Plus, nhưng phải nói là cái gọi là tông của câu trả lời ấy nhỉ? Dù cùng tên là o1, cảm giác tổng thể giờ đã khác hẳn so với bản preview. Thậm chí tôi còn có cảm giác như ai đó đang kìm hãm lượng token đầu ra vậy.
Tôi đồng ý. Tôi cũng cảm nhận được rằng ngay cả khi dùng cùng một phiên bản tại cùng một thời điểm, hiệu năng vẫn lên xuống mà không có bất kỳ thông báo riêng nào. Hơi lạc đề một chút, nhưng với những dịch vụ nói rằng họ không thu thập thông tin thì cũng không có cách nào để kiểm chứng, nên cuối cùng có lẽ vẫn chỉ là vấn đề niềm tin.
Ý kiến trên Hacker News
OpenAI đang cạnh tranh giữa tốc độ phát triển của các lựa chọn thay thế mã nguồn mở và nhu cầu tạo doanh thu. Việc họ có thành công hay không phụ thuộc vào việc các tập đoàn lớn có chọn giải pháp AI tích hợp và an toàn của OpenAI hay không. Điều này tương tự chiến lược điện toán doanh nghiệp của IBM.
Có sự bất mãn vì cửa sổ ngữ cảnh của bản Pro quá ngắn. Với tư cách là thành viên Plus, người dùng đã kỳ vọng cửa sổ ngữ cảnh dài hơn, nhưng hoàn toàn không có bất kỳ thảo luận nào về điều đó. Rất khuyến nghị các đối thủ xem cửa sổ ngữ cảnh như một điểm khác biệt.
Ấn tượng đầu tiên sau khi mua gói Pro là mô hình o1-Pro mới là một cây bút rất xuất sắc. Nó xử lý tốt các prompt dài và phân tích dữ liệu phức tạp.
Kế hoạch cung cấp nhiều năng lực tính toán hơn có thể được giải thích bằng hiệu ứng mồi nhử trong chiến thuật định giá. Việc đưa ra một lựa chọn giá cao khiến các gói khác trông hợp lý hơn.
Có người trả 166 euro mỗi tháng cho Claude Teams. Lý do là tính năng dự án kết hợp với khả năng tải lên nhiều tệp và đặt câu hỏi trong một ngữ cảnh cụ thể. Tính năng này mạnh đến mức giống như có sẵn các nhà nghiên cứu ngay trong tầm tay.
Có thể nhận được hiệu năng tốt hơn từ Anthropic với chi phí rẻ hơn rất nhiều. Có sự hoài nghi về tuyên bố rằng GPT mới vượt trội hơn Claude gấp 10 lần.
Có người nghi ngờ liệu OpenAI có thể đạt tới AI “tổng quát” trước khi các nhà đầu tư mất kiên nhẫn hay không. Có thể họ đã ngầm cho thấy thông qua thành công của ChatGPT rằng họ có một con đường để đạt được điều đó.
Khó khăn lớn nhất của mô hình định giá thuê bao hàng tháng cho việc sử dụng sản phẩm “không giới hạn” là 1% người dùng siêu nặng với mức sử dụng cực đoan. Mức giá của ChatGPT Pro nhắm đến nhóm power user/doanh nghiệp.
Có người đã dành 4,5 giờ để viết một công thức Google Sheets phức tạp. Nếu chế độ ChatGPT Pro mới nhanh hơn, thì nó có lợi thế lớn về mặt tiết kiệm thời gian.
Có trường hợp dùng mô hình o1 để thực hiện phỏng vấn trong các interview mill. Với kiểu use case này, mức phí 200 USD mỗi tháng có thể sẽ thấy là rẻ.