2 điểm bởi princox 2026-02-11 | 1 bình luận | Chia sẻ qua WhatsApp

Vài tháng trước, chúng tôi đã ra mắt Composer 1, mô hình lập trình dựa trên tác tử đầu tiên của mình. Kể từ đó, chúng tôi đã đạt được những cải thiện đáng kể về năng lực lập trình của mô hình.

Composer 1.5 mới ra mắt tạo được sự cân bằng mạnh mẽ giữa tốc độ và trí tuệ cho nhu cầu sử dụng hằng ngày. Composer 1.5 được xây dựng bằng cách mở rộng học tăng cường trên cùng mô hình tiền huấn luyện lên gấp 20 lần. Lượng tài nguyên tính toán dành cho giai đoạn hậu huấn luyện của Composer 1.5 vượt xa lượng đã dùng cho tiền huấn luyện của mô hình nền tảng.

Trong quá trình mở rộng, năng lực lập trình tiếp tục được cải thiện ổn định. Theo các phép đo benchmark nội bộ dựa trên những bài toán lập trình thực tế, mô hình này nhanh chóng vượt qua Composer 1 và hiệu năng tiếp tục tăng lên. Mức cải thiện đặc biệt rõ rệt ở các tác vụ có độ khó cao.

Composer 1.5 là một mô hình suy luận. Trong quá trình phản hồi truy vấn, mô hình tạo ra các token suy nghĩ để suy luận về codebase của người dùng và lên kế hoạch cho bước tiếp theo. Chúng tôi xác nhận rằng các bước suy nghĩ này là yếu tố cốt lõi đối với trí tuệ của mô hình. Đồng thời, chúng tôi muốn duy trì tốc độ và tính tương tác của Composer 1.5 cho nhu cầu sử dụng hằng ngày. Để đạt được sự cân bằng, mô hình được huấn luyện để phản hồi nhanh với lượng suy nghĩ tối thiểu đối với các vấn đề dễ, và suy nghĩ cho đến khi tìm được câu trả lời thỏa đáng đối với các vấn đề khó.

Để xử lý các tác vụ chạy trong thời gian dài, Composer 1.5 có khả năng tự tóm tắt. Nhờ đó, mô hình có thể tiếp tục tìm kiếm lời giải ngay cả khi phần ngữ cảnh khả dụng đã cạn kiệt. Chúng tôi đã huấn luyện Composer 1.5 khả năng tự tóm tắt như một phần của học tăng cường (RL), bằng cách yêu cầu mô hình tạo ra bản tóm tắt hữu ích khi ngữ cảnh bị tiêu hao trong lúc huấn luyện. Với những ví dụ khó, quá trình này có thể xảy ra đệ quy nhiều lần. Thông qua tính năng tự động tóm tắt, chúng tôi xác nhận rằng mô hình có thể giữ nguyên độ chính xác ban đầu ngay cả khi độ dài ngữ cảnh thay đổi.

Composer 1.5 là mô hình mạnh hơn rất nhiều so với Composer 1 và được khuyến nghị cho sử dụng tương tác. Quá trình huấn luyện của mô hình này chứng minh rằng RL cho lập trình có thể tiếp tục mở rộng với mức cải thiện trí tuệ có thể dự đoán được.

Có thể xem giá tại đây -> https://cursor.com/docs/models

1 bình luận

 
leeyeonwoo 2026-02-13

Tôi khá nghi ngờ liệu một công ty làm công cụ AI có thực sự cũng giỏi làm AI hay không