- gpt-4.1 là một trợ lý cẩn trọng và đáng tin cậy, có thế mạnh ở việc hiểu mã chính xác và cách tiếp cận thận trọng
- gemini 2.5 pro xuất sắc trong xử lý ngữ cảnh rộng và cả phân tích hình ảnh, nhưng cũng có rủi ro gây chỉnh sửa quá tay
- sonnet 3.5/3.7 sáng tạo và thông minh, nhưng thiếu khả năng duy trì ngữ cảnh và tính nhất quán nên dễ chệch hướng trong hội thoại dài
- grok-3-beta chậm nhưng cho thấy tiềm năng vượt trội trong trực quan hóa thiết kế và giải quyết vấn đề phức tạp
- Người dùng tách riêng các mô hình theo từng luồng công việc, và khi debug thất bại, họ ưu tiên chiến lược khôi phục checkpoint và chuyển đổi mô hình
gpt-4.1
- Hoạt động như một trợ lý thông minh và có độ tin cậy cao
- Không vội đưa ra kết luận, làm theo yêu cầu nhưng không chỉnh sửa quá mức
- Là mô hình mang lại cảm giác như phần mở rộng của chính lập trình viên, đặc biệt phù hợp với các nhà phát triển giàu kinh nghiệm
gemini 2.5 pro
- Mạnh khi tận dụng ngữ cảnh rộng như log console dài hoặc toàn bộ file mã nguồn
- Khả năng phân tích hình ảnh rất tốt, có thể phát hiện lỗi trực quan
- Nhược điểm là hoạt động quá tự chủ, có thể gây xóa mã không cần thiết hoặc chỉnh sửa quá tay
- Cần kiểm soát cẩn thận
sonnet 3.5 / 3.7
- 3.7 sáng tạo và thông minh, nhưng trong hội thoại dài đôi khi bị mất ngữ cảnh hoặc bỏ qua chỉ dẫn
- 3.5 mạnh trong việc hiểu và chỉnh sửa mã dựa trên một file đơn
- Do các vấn đề chuyển tiếp trong tích hợp với Cursor nên chưa thể hiện hiệu năng ổn định và nhất quán
Các ý kiến và chiến lược khác
- grok-3-beta chậm nhưng hữu ích trong việc giải quyết những vấn đề mà các mô hình khác thất bại
- Một người dùng đang áp dụng chiến lược phân công mô hình như sau:
- o3/4-mini: sắp xếp kế hoạch và tổ chức suy luận dựa trên Markdown
- gemini 2.5 pro: phân tích vấn đề dựa trên toàn bộ file và dùng để gọi tính năng
- sonnet 3.5: dùng để chỉnh sửa một file đơn dựa trên
cmd+k
5 bình luận
Có thể khẳng định rằng Gemini 2.5 Pro là mạnh nhất, ít nhất là xét riêng với ngôn ngữ Go.
Janimai có tốc độ nhanh nhất nên tôi khuyến nghị dùng cho mục đích hỏi đáp.
Tôi chủ yếu chỉ dùng Sonnet
rất đồng cảm với nhiều điều trong bài viết
Chắc tôi cũng nên thử 4.1
Tôi thấy khá giống với cảm nhận của mình. Càng dùng sonnet thì tôi càng thấy bất an, còn chatgpt 4.1 thì dù có đưa yêu cầu xong, trước hết vẫn là kiểu khiến tôi yên tâm hơn.
Tôi cũng đồng cảm với ý kiến về Grok, nhưng tôi thường dùng nó nhiều hơn khi bình tĩnh kiểm tra trong cửa sổ chat thay vì ở bên trong IDE.
Phản ứng của cộng đồng Reddit
Cách sử dụng model
Chiến lược sử dụng và workflow
Các ý kiến khác