- Ra mắt 3 mô hình: GPT-4.1, GPT-4.1 mini, GPT-4.1 nano
- Cung cấp hiệu năng được cải thiện toàn diện so với GPT-4o, đặc biệt nổi bật ở lập trình, làm theo chỉ dẫn, hiểu ngữ cảnh dài
- Cả ba mô hình đều hỗ trợ cửa sổ ngữ cảnh tối đa 1 triệu token, phù hợp cho phân tích codebase lớn và tài liệu phức tạp
- Mang lại hiệu năng vượt trội cùng với giảm độ trễ và giảm chi phí
- Các cải thiện hiệu năng chính
- Khả năng lập trình: đạt 54.6% trên SWE-bench Verified, tăng +21.4 điểm phần trăm so với GPT-4o
- Làm theo chỉ dẫn: điểm MultiChallenge 38.3%, tăng +10.5 điểm phần trăm so với GPT-4o
- Hiểu ngữ cảnh dài đa phương thức: đạt 72.0% trên Video-MME(long, no subtitles), cao hơn GPT-4o +6.7 điểm phần trăm
- Đặc điểm của dòng mô hình GPT-4.1
- GPT-4.1 mini: kết quả đánh giá trí tuệ vượt GPT-4o, độ trễ bằng một nửa, chi phí giảm 83%
- GPT-4.1 nano: chi phí thấp nhất và độ trễ thấp nhất, vẫn duy trì hiệu năng cao
- GPT-4.5 Preview dự kiến ngừng vào ngày 14 tháng 7 năm 2025, khuyến nghị chuyển sang dòng GPT-4.1
- Thị giác máy tính (hiểu hình ảnh và đa phương thức)
- GPT-4.1 mini vượt GPT-4o trên các benchmark dựa trên hình ảnh
- Độ chính xác cao trên MMMU, MathVista, CharXiv
- Video-MME (câu hỏi về video 30~60 phút không có phụ đề): độ chính xác 72.0%
- Chính sách giá
- Tất cả mô hình đều đã được công bố và có thể sử dụng
- GPT-4.1 rẻ hơn GPT-4o trung bình 26%
- GPT-4.1 nano là mô hình có chi phí thấp nhất
- Giảm giá 75% cho đầu vào được cache, không có phụ phí cho ngữ cảnh dài
- Giá theo từng mô hình
- GPT-4.1: đầu vào $2.00 cho mỗi 1 triệu token, đầu ra $8.00, chi phí trung bình khoảng $1.84
- GPT-4.1 mini: đầu vào $0.40, đầu ra $1.60, trung bình $0.42
- GPT-4.1 nano: đầu vào $0.10, đầu ra $0.40, trung bình $0.12
- Mở rộng ưu đãi cache prompt từ 50% lên tối đa 75%
- Yêu cầu ngữ cảnh dài không tính thêm phí, chỉ tính theo lượng token sử dụng
1 bình luận
Ý kiến Hacker News
Người dùng ChatGPT bày tỏ sự bối rối trước việc phải chọn giữa nhiều mô hình khác nhau
So sánh SWE-bench Verified, Aider Polyglot, chi phí, token đầu ra mỗi giây, mốc cắt kiến thức theo tháng/năm
OAI đã phát hành hướng dẫn prompt cho GPT 4.1
Theo công bố của OpenAI, GPT-4.1 đưa ra đề xuất tốt hơn trong 55% trường hợp trong cuộc đối đầu tạo code review với Claude Sonnet 3.7
Trong TED Talk gần đây, Sam nói rằng mô hình đến rồi đi nhưng họ muốn trở thành nền tảng tốt nhất
Chia sẻ trải nghiệm dùng GPT-4.1 với codebase phức tạp
Nêu lên nhu cầu cần benchmark về hiệu năng của các mô hình có giới hạn token tối đa dài
Các phòng thí nghiệm AI lớn đang đồng thời tham gia nhiều cuộc chiến thị trường
Kết quả GPT-4.1 tóm tắt một chủ đề Hacker News có 164 bình luận